Zur Zeit wird gefiltert nach: PDF/A
Filter zurücksetzen
Frage:
Welche Erweiterungen bietet PDF/A-2 für gescannte Dokumente?
Antwort:
Der weitere Normteil PDF/A-2 basiert auf dem PDF Standard ISO 32000, der wiederum auf PDF 1.7 (entspricht Acrobat 8) aufsetzt.
Fünf Funktionen können die Verwendung von PDF/A-2 im Scan-Bereich interessant machen:
1. JPEG2000
JPEG2000 wurde mit PDF 1.5 eingeführt und ist somit nur aus zeitlichen Gründen nicht in PDF/A-1 eingeflossen. JPEG2000 bietet eine Lossless-Kompression, die z.B. bei Bibliotheken oft für das sogenannte Digitale Original verwendet wird. Diese Lossless-Datei kann jetzt in PDF/A eingebettet werden und bietet dann die Vorteile, dass eine OCR realisiert werden kann und auch die Metadaten standardkonform in die Datei eingebettet werden können. JPEG2000 mit Lossy-Kompression ist für alle Dokumente interessant, die mit dem LuraTech Ebenen-Verfahren (MRC: Mixed Raster Content) bearbeitet werden. Im Vergleich zu PDF/A-1 sind hier noch mal ca. 10-20% mehr Kompression möglich, aber insbesondere wird mit dem besseren Verfahren die Qualität der Bildanteile besser.
2. Layer bzw. Optional Content
Diese Funktion ist in PDF/A-2 allgemein für z.B. mehrsprachige Dokumente mit dann schaltbaren Sprachen interessant oder wenn z.B. bei Konstruktionsplänen erst ein Überblick gezeigt werden soll und dann Details dazu geschaltet werden sollen. Bei LuraTech-PDF/A-Dateien können dann die 3 Ebenen des MRC-Verfahrens beliebig ein- und ausgeschaltet werden. Das ist dann hilfreich, wenn man z.B. nur die Schwarz/Weiss-Ebene eines Farbdokuments anzeigen möchte oder S/W und Textfarben schalten, um eine Datei beispielsweise ohne störenden Hintergrund zu drucken.
3. PDF/A-2u (U für Unicode)
PDF/A-1 kennt die Conformance Level 1a und 1b. Im Bereich der gescannten Dokumente (oder auch im Output-Bereich) ist die Verwendung von 1b gängige Praxis, weil die Anforderungen von 1a an das Tagging nur mit sehr hohem manuellen Aufwand zu erfüllen wären, die bei Massen-Scanning nicht wirtschaftlich sind. PDF/A-2 hat weiterhin die Level 2a und 2b, aber als Level dazwischen wurde PDF/A-2u eingeführt, um die Vorteile von Unicode ausnutzen zu können. Bei gescannten Dokumenten mit OCR-Volltextfähigkeit wird durch Unicode eine sichere Text-Extraktion und bessere Suche erreicht. Es ist zu erwarten, dass bei Einsatz von PDF/A-2 meist der 2u-Level gewählt werden wird.
4. Portfolios bzw. Collections
Hier bietet PDF/A-2 allgemein die Möglichkeit, PDF/A-Dateien in PDF/A einzubetten. Klassisches Anwendungsbeispiel ist die Konvertierung von E-Mails nach PDF/A, wo mit Collections die E-Mail und die Attachments in eine logische Datei zusammengeführt werden können. Bei gescannten Dokumenten können Collections hilfreich sein, wenn z.B. im Posteingang Einzelseiten gescannt und signiert werden müssen, weil eine spätere Umsortierung in der Sachbearbeitung möglich sein muß, ohne die Signatur zu brechen.
5. Höhere Seitengröße
PDF/A-1 hat ein Seitenlimit von ca. 5m mal 5m und dieses Limit wurde jetzt mit PDF/A-2 auf ca. 381 km mal 381 km erweitert. Für normale Geschäftsdokumente im DIN A4-Format ist das natürlich kein Thema, aber bei Großformat-Scans oder sehr langen Dokumenten kann das alte Limit schon mal erreicht werden. Bei geografischen Anwendungen können Dokumente damit auch im Maßstab 1:1 gespeichert werden, was z.B. Messungen im digitalisierten Plan ermöglicht. LuraTech hat als führender PDF/A-Anbieter den LuraDocument PDF Compressor schon während der PDF/A-Konferenz in Rom als „PDF/A-2 ready“ vorgestellt und ist somit in der Lage, kurz nach ISO-Veröffentlichung des PDF/A-2 Standards seinen Kunden eine Release-Version anzubieten.
Frage: Ich habe gehört, dass es bald eine neue Version des PDF/A Standards geben wird. Was wird sich damit ändern?
Antwort: Wichtig ist zunächst, dass der neue Normteil PDF/A-2 die bisherige Variante nicht ablösen oder korrigieren wird, sondern PDF/A-1 wird weiter als eigenständiger Standard gültig bleiben. Alle bestehenden oder auch zukünftig erzeugten PDF/A-1 Dokumente sind und bleiben ohne Einschränkung langzeitarchivierbar.
Warum dann eine Version 2? Das PDF Format wird fortlaufend weiter entwickelt. Während PDF/A-1 noch auf der PDF Version 1.4 basiert, ist die aktuelle PDF Spezifikation inzwischen in der Version 1.7. Außerdem ist die PDF Spezifikation im Jahr 2008 auch selbst als ISO Standard veröffentlicht worden (ISO 32000-1). Seit PDF 1.4 wurde eine Vielzahl von neuen Möglichkeiten in das PDF Format aufgenommen, darunter auch einige, die für die Langzeitarchivierung interessant sind. PDF/A-2 wird deshalb auf dem neuen PDF Standard aufbauen. Die neuen Möglichkeiten in PDF/A-2 betreffen unter anderem Dokument-Sammlungen, Metadaten, Bildformate und Transparenz. Für LuraTech Kunden von besonderer Bedeutung wird die Unterstützung von JPEG 2000 in PDF/A-2 sein. Damit werden für hochkomprimierte PDF/A Dokumente, eine noch bessere Qualität und noch geringere Dateigröße erreicht, wie sie bisher nur für die Standard-PDF Ausgabe möglich war.
LuraTech ist aktiv an der Weiterentwicklung des PDF/A-Standards beteiligt, so dass unsere Kunden mit die ersten sein werden, die von den neuen Entwicklungen profitieren können.
Mit der zunehmenden Verbreitung von PDF/A als ISO-Standard für die Langzeitarchivierung haben sich leider auch einige Missverständnisse verbreitet. Nach knapp vier Jahren scheinen immer noch einige DMS-Hersteller zu versuchen, das Thema PDF/A „auszusitzen“, aber da gilt dann aus meiner Sicht: „Wer zu spät kommt, den bestraft das Leben!“
Mythos 1: TIFF ist revisionssicher, PDF und PDF/A nicht
Diese Behauptung ist eindeutig falsch. Es gibt kein Dokumentformat, das von sich aus revisionssicher ist. Eine TIFF-Datei kann genauso mit einfachen Tools geändert werden wie ein PDF/A-Dokument oder eben andere Dokumente. Die Unveränderbarkeit von Dokumenten kann nur durch eine Signatur erreicht werden. Wenn man Dateien revisionssicher aufbewahren muss, dann ist weiterhin ein System oder Verfahren notwendig, welches die Revisionssicherheit garantiert.
Mythos 2: PDF ist ein 1-Hersteller-Standard, TIFF ist offengelegt
Ja und Nein. TIFF ist ein Industrie- also ein De-facto-Standard, aber bis heute von keiner internationalen Normierungsorganisation (ISO, DIN etc.) normiert. Sowohl PDF selber (ISO 32000) als auch PDF/A (ISO 19005) sind offengelegte ISO-Standards und damit nicht nur ein De-facto-, sondern auch ein De-jure-Standard.
Mythos 3: PDF/A unterstützt keine Signaturen
Ganz im Gegenteil. PDF/A erlaubt sogar eingebettete Signaturen – bis hin zur qualifizierten Elektronischen Signatur. Der Signatur-Hersteller muss die Signatur dafür lediglich mit seinem Produkt PDF/A-konform anbringen, aber hier gibt es in der Praxis noch Signaturanbieter, die das noch nicht mit Ihren Produkten beherrschen
Mythos 4: PDF/A erlaubt keine Kompression
Falsch. PDF/A erlaubt alle gängigen Kompressions-Schemata wie JBIG2, JPEG, etc. Ausnahme ist LZW, wo zur Zeit der Standardisierung noch Patente gültig waren. Aus diesen zeitlichen Gründen ist auch JPEG2000 noch nicht in PDF/A-1 eingeflossen, kommt dafür aber in der neuen Version, also mit PDF/A-2.
Mythos 5: PDF/A erlaubt keine OCR für gescannte Dokumente
Falsch. OCR ist sowohl in PDF/A-1b als natürlich auch in PDF/A-1a erlaubt. Kleine Spezialität – und vielleicht Ursache der Verwirrung– ist die Ausnahme, dass dieser unsichtbare Font nicht eingebettet sein muss.
Mythos 6: PDF/A-Dateien werden wegen Font-Einbettung zu groß
Ja und Nein. Richtig ist, dass Fonts (außer OCR) eingebettet werden müssen. Das ist aufgrund der praktischen Erfahrungen nur in dem speziellen Anwendungsgebiet Massen-Ausgangspost ggf. ein Problem. In diesem Bereich kann man mit Font-Reduzierung und Subsetting arbeiten oder pragmatisch und unternehmensindividuell auf die Font-Einbettung verzichten. Diese Dateien sind dann nach „reiner Lehre“ keine PDF/As mehr. Es bleiben aber – bis auf die bewusste Ausnahme – alle Vorteile von PDF/A erhalten.
Mythos 7: PDF/A erlaubt keine Metadaten
Im Gegenteil. Gerade durch XMP sind standardisierte Metadaten in PDF/A möglich. Metadaten können, wie bisher, in den umgebenden Systemen verwaltet werden. Ein Vorteil von PDF/A ist, dass diese auch untrennbar in das Dokument eingebettet werden können.
Mythos 8: PDF/A wird nicht von DMS-Systemen unterstützt
Ja und Nein. Einfach gesagt, kann ein ECM-System auch gut PDF/A unterstützen, das mit PDF umgehen kann. Es gibt aber (leider) noch eine Reihe von DMS-Herstellern, die auf ihre ausgereizten TIFF-Viewer setzen, und das kann in der Praxis manchmal wirklich ein „Hemmschuh“ sein.
Mythos 9: PDF/A wird nur von einer kleinen Gruppe hiesiger Anbieter gefördert
Ganz falsch! Es ist sicher richtig, dass PDF/A im deutschsprachigen Raum zuerst – auch durch die Gründung des PDF/A Competence Center in Deutschland – angenommen wurde. Mittlerweile gibt es in vielen Ländern und Branchen Empfehlungen oder sogar gesetzliche Vorgaben für PDF/A. By the way: Das PDF/A Competence Center hat inzwischen über 100 Mitglieder aus circa 20 Ländern!
Mythos 10: PDF/A ist teuer!
Ja und nein. Sicher erfordert der Einsatz von PDF/A-Werkzeugen erst einmal Investitionen. Manchmal lässt sich der ROI durch hochkomprimierte PDF/A-Dateien innerhalb weniger Monate sogar ohne Excel ausrechnen, wie z. B. im Sparkassen-Bereich. Aber das ist vielleicht eher die Ausnahme. Das Problem dabei ist die Bewertung der Vorteile: Denn wie viel ist es wert, wenn durch Format-Vereinheitlichung Schulungsaufwand und Gebühren für Viewer-Lizenzen eingespart werden und in der Zukunft weniger Migrationen notwendig sind? Und nicht zuletzt: Wie bewertet man ein dank standardisierter PDF/A Dateien „gutes“ Archiv?
Frage: Ich habe eine sehr große Menge an Dokumenten, die wichtige Informationen enthalten und die ich mindestens zehn Jahre aufbewahren muss. Soviel ich weiß, ist PDF/A das beste Format für die Langzeitarchivierung. Kann ich alle meine Dokumente mit dem PDF Compressor Enterprise in hochkomprimierte PDF/A Dokumente verwandeln und diese im Volltext durchsuchbar machen?
Antwort: Ja, PDF/A ist ein ISO-standardisiertes Format und tatsächlich das beste Format für die Langzeitarchivierung! Mit PDF/A ist gewährleistet, dass Dokumente in einem Format archiviert sind, mit dem ihre Verfügbarkeit und Lesbarkeit erhalten bleiben – unabhängig davon, mit welchem Programm oder System sie ursprünglich erzeugt wurden. Und ja, der PDF Compressor Enterprise ist das richtige Werkzeug für Sie, denn er verbindet unsere preisgekrönte Mixed-Raster-Content (MRC Layer-Verfahren) Kompressionstechnologie mit der OCR-FineReader-Technologie von ABBYY. Durch den PDF Compressor Enterprise werden Ihre Dokumente im Stapelverfahren in hochkomprimierte PDF/A Dokumente umgewandelt, welche darüber hinaus dann im Volltext durchsuchbar sind. Die Dokumente belegen dann nur noch sehr wenig Speicherplatz bleiben aber durch das PDF/A Format langfristig lesbar.
Frage:
Hallo! Wir sind Scandienstleister und möchten Ihren PDF Compressor Enterprise bei einer Kundenausschreibung (Scanprojekt) anbieten. Allerdings würde ich vorher gerne die Projektlaufzeit ermitteln. Welche Angaben benötigen Sie, um mir sagen zu können, wie lange ich brauche um alle gescannten Seiten mit dem PDF Compressor Enterprise nach PDF/A zu konvertieren und zu komprimieren?
Antwort:
Guten Tag. Nun, man kann tatsächlich nicht pauschal sagen, wie lange Sie für die Bearbeitung pro Seite brauchen, da das von unterschiedlichen Faktoren abhängt. Zu diesem Zweck haben wir eine kleine Tabelle entwickelt, die die wichtigsten Eckdaten unserer Kunden abfragt und somit eine schnellstmögliche Beantwortung der Anfragen ermöglichen soll.
Sobald wir diese Angaben haben, rechnen wir Ihnen gerne aus, wie viel Zeit Sie für Ihr Projekt benötigen und, wenn Sie eine feste Zeitvorgabe haben, wie viele CPU Cores Sie dann sinnvollerweise nutzen sollten. Dadurch wird auch eine bessere Beratung hinsichtlich unserer Lizenzmodelle erreicht.
Für mehr Informationen zu unseren flexiblen Lizenzmodellen klicken Sie bitte hier!
Frage:
Hallo, was mache ich mit meinen MS-Office Dokumenten? Kann ich die auch stapelweise nach PDF/A konvertieren?
Antwort:
Ja, Ihre digital erzeugten Dokumente können Sie jetzt auch genau wie gescannte Dokumente, ganz einfach stapelweise nach PDF/A konvertieren und damit für die Langzeitarchivierung optimal vorbereiten. Mit dem Modul „Born Digital Option“, das zu unserem PDF Compressor Enterprise erhältlich ist, können alle digital erzeugten Dokumente aus MS-Office, Outlook eMails mit Anhängen und elektronisch erstellte PDFs bearbeitet und nach PDF oder PDF/A konvertiert werden. Das Modul „Born Digital Option“ ist zu allen verfügbaren Lizenzmodellen Basic, Advanced und Server erhältlich.
Für eine kostenlose Demoversion unseres Born Digital Modules klicken Sie bitte hier!
Frage:
Was ist der Unterschied zwischen PDF und PDF/A?
Antwort:
PDF/A basiert auf dem PDF Format. Im Gegensatz zu dem herkömmlichen PDF Format, wurde der PDF/A ISO-Standard zur Langzeitarchivierung elektronischer Dokumente konzipiert. Damit bleibt die visuelle Darstellung elektronischer Dokumente erhalten, unabhängig davon, mit welchem Werkzeug oder System sie ursprünglich erstellt bzw. gespeichert wurden. Der PDF/A-Standard definiert keine Archivstrategie oder Ziele eines Archivsystems, sondern ist ein "Profil" für elektronische Dokumente, mit dem diese über lange Jahre hinweg reproduzierbar bleiben.
Für mehr Informationen, klicken Sie bitte hier.