Frage:
Welche Erweiterungen bietet PDF/A-2 für gescannte Dokumente?
Antwort:
Der weitere Normteil PDF/A-2 basiert auf dem PDF Standard ISO 32000, der wiederum auf PDF 1.7 (entspricht Acrobat 8) aufsetzt.
Fünf Funktionen können die Verwendung von PDF/A-2 im Scan-Bereich interessant machen:
1. JPEG2000
JPEG2000 wurde mit PDF 1.5 eingeführt und ist somit nur aus zeitlichen Gründen nicht in PDF/A-1 eingeflossen. JPEG2000 bietet eine Lossless-Kompression, die z.B. bei Bibliotheken oft für das sogenannte Digitale Original verwendet wird. Diese Lossless-Datei kann jetzt in PDF/A eingebettet werden und bietet dann die Vorteile, dass eine OCR realisiert werden kann und auch die Metadaten standardkonform in die Datei eingebettet werden können. JPEG2000 mit Lossy-Kompression ist für alle Dokumente interessant, die mit dem LuraTech Ebenen-Verfahren (MRC: Mixed Raster Content) bearbeitet werden. Im Vergleich zu PDF/A-1 sind hier noch mal ca. 10-20% mehr Kompression möglich, aber insbesondere wird mit dem besseren Verfahren die Qualität der Bildanteile besser.
2. Layer bzw. Optional Content
Diese Funktion ist in PDF/A-2 allgemein für z.B. mehrsprachige Dokumente mit dann schaltbaren Sprachen interessant oder wenn z.B. bei Konstruktionsplänen erst ein Überblick gezeigt werden soll und dann Details dazu geschaltet werden sollen. Bei LuraTech-PDF/A-Dateien können dann die 3 Ebenen des MRC-Verfahrens beliebig ein- und ausgeschaltet werden. Das ist dann hilfreich, wenn man z.B. nur die Schwarz/Weiss-Ebene eines Farbdokuments anzeigen möchte oder S/W und Textfarben schalten, um eine Datei beispielsweise ohne störenden Hintergrund zu drucken.
3. PDF/A-2u (U für Unicode)
PDF/A-1 kennt die Conformance Level 1a und 1b. Im Bereich der gescannten Dokumente (oder auch im Output-Bereich) ist die Verwendung von 1b gängige Praxis, weil die Anforderungen von 1a an das Tagging nur mit sehr hohem manuellen Aufwand zu erfüllen wären, die bei Massen-Scanning nicht wirtschaftlich sind. PDF/A-2 hat weiterhin die Level 2a und 2b, aber als Level dazwischen wurde PDF/A-2u eingeführt, um die Vorteile von Unicode ausnutzen zu können. Bei gescannten Dokumenten mit OCR-Volltextfähigkeit wird durch Unicode eine sichere Text-Extraktion und bessere Suche erreicht. Es ist zu erwarten, dass bei Einsatz von PDF/A-2 meist der 2u-Level gewählt werden wird.
4. Portfolios bzw. Collections
Hier bietet PDF/A-2 allgemein die Möglichkeit, PDF/A-Dateien in PDF/A einzubetten. Klassisches Anwendungsbeispiel ist die Konvertierung von E-Mails nach PDF/A, wo mit Collections die E-Mail und die Attachments in eine logische Datei zusammengeführt werden können. Bei gescannten Dokumenten können Collections hilfreich sein, wenn z.B. im Posteingang Einzelseiten gescannt und signiert werden müssen, weil eine spätere Umsortierung in der Sachbearbeitung möglich sein muß, ohne die Signatur zu brechen.
5. Höhere Seitengröße
PDF/A-1 hat ein Seitenlimit von ca. 5m mal 5m und dieses Limit wurde jetzt mit PDF/A-2 auf ca. 381 km mal 381 km erweitert. Für normale Geschäftsdokumente im DIN A4-Format ist das natürlich kein Thema, aber bei Großformat-Scans oder sehr langen Dokumenten kann das alte Limit schon mal erreicht werden. Bei geografischen Anwendungen können Dokumente damit auch im Maßstab 1:1 gespeichert werden, was z.B. Messungen im digitalisierten Plan ermöglicht. LuraTech hat als führender PDF/A-Anbieter den LuraDocument PDF Compressor schon während der PDF/A-Konferenz in Rom als „PDF/A-2 ready“ vorgestellt und ist somit in der Lage, kurz nach ISO-Veröffentlichung des PDF/A-2 Standards seinen Kunden eine Release-Version anzubieten.
Sie haben keine Berechtigung einen Kommentar zu hinterlassen.