Frage:
DocYard das neue LuraTech Produkt ist eine Integrationsplatform - Wie können wir als Scandienstleister von so einem Produkt profitieren?
Antwort:
Der Schwerpunkt von DocYard sind produktionstaugliche Workflows der Dokumentenkonvertierung. Der Focus dieser Plattform liegt dabei tatsächlich auf Integration - Sie können alle Ihre bereits vorhandenen Tools behalten und sie in DocYard in der Form von DocYard Modulen integrieren. Das bedeutet im einzelnen, dass Sie dann kein riesen Integrationsprojekt starten, kein Rollout im kompletten Unternehmen planen oder Ihre ganze Organisation auf den Kopf stellen müssen. Schon getätigte Investitionen in Systeme und Komponenten sind geschützt und werden durch die Einführung von DocYard aufgewertet.
Stattdessen können Sie klein anfangen, indem Sie einen einzelnen Workflow oder sogar nur einen Teil eines Workflows implementieren und später die Implementierung schrittweise ausbauen. Trotzdem profitieren Sie sofort sowohl von DocYards einheitlichem Management und Reporting als auch von seiner Unterstützung von Parallel Processing.
Darüber hinaus lässt sich unnötiges Kopieren von Dateien von Hand oder per Skript vermeiden - die DocYard Infrastruktur verschiebt alle Daten für sie.
Schließlich ermöglicht DocYard die Integration manueller und automatisierter Prozesse. Das führt zu einer nahtlosen Kombination von z.B. manuellem Indizieren oder interaktiver Qualitätskontrolle mit vollautomatischen Prozessen, wie Kompression oder OCR.
Frage: Ich habe gehört, dass es bald eine neue Version des PDF/A Standards geben wird. Was wird sich damit ändern?
Antwort: Wichtig ist zunächst, dass der neue Normteil PDF/A-2 die bisherige Variante nicht ablösen oder korrigieren wird, sondern PDF/A-1 wird weiter als eigenständiger Standard gültig bleiben. Alle bestehenden oder auch zukünftig erzeugten PDF/A-1 Dokumente sind und bleiben ohne Einschränkung langzeitarchivierbar.
Warum dann eine Version 2? Das PDF Format wird fortlaufend weiter entwickelt. Während PDF/A-1 noch auf der PDF Version 1.4 basiert, ist die aktuelle PDF Spezifikation inzwischen in der Version 1.7. Außerdem ist die PDF Spezifikation im Jahr 2008 auch selbst als ISO Standard veröffentlicht worden (ISO 32000-1). Seit PDF 1.4 wurde eine Vielzahl von neuen Möglichkeiten in das PDF Format aufgenommen, darunter auch einige, die für die Langzeitarchivierung interessant sind. PDF/A-2 wird deshalb auf dem neuen PDF Standard aufbauen. Die neuen Möglichkeiten in PDF/A-2 betreffen unter anderem Dokument-Sammlungen, Metadaten, Bildformate und Transparenz. Für LuraTech Kunden von besonderer Bedeutung wird die Unterstützung von JPEG 2000 in PDF/A-2 sein. Damit werden für hochkomprimierte PDF/A Dokumente, eine noch bessere Qualität und noch geringere Dateigröße erreicht, wie sie bisher nur für die Standard-PDF Ausgabe möglich war.
LuraTech ist aktiv an der Weiterentwicklung des PDF/A-Standards beteiligt, so dass unsere Kunden mit die ersten sein werden, die von den neuen Entwicklungen profitieren können.
Mit der zunehmenden Verbreitung von PDF/A als ISO-Standard für die Langzeitarchivierung haben sich leider auch einige Missverständnisse verbreitet. Nach knapp vier Jahren scheinen immer noch einige DMS-Hersteller zu versuchen, das Thema PDF/A „auszusitzen“, aber da gilt dann aus meiner Sicht: „Wer zu spät kommt, den bestraft das Leben!“
Mythos 1: TIFF ist revisionssicher, PDF und PDF/A nicht
Diese Behauptung ist eindeutig falsch. Es gibt kein Dokumentformat, das von sich aus revisionssicher ist. Eine TIFF-Datei kann genauso mit einfachen Tools geändert werden wie ein PDF/A-Dokument oder eben andere Dokumente. Die Unveränderbarkeit von Dokumenten kann nur durch eine Signatur erreicht werden. Wenn man Dateien revisionssicher aufbewahren muss, dann ist weiterhin ein System oder Verfahren notwendig, welches die Revisionssicherheit garantiert.
Mythos 2: PDF ist ein 1-Hersteller-Standard, TIFF ist offengelegt
Ja und Nein. TIFF ist ein Industrie- also ein De-facto-Standard, aber bis heute von keiner internationalen Normierungsorganisation (ISO, DIN etc.) normiert. Sowohl PDF selber (ISO 32000) als auch PDF/A (ISO 19005) sind offengelegte ISO-Standards und damit nicht nur ein De-facto-, sondern auch ein De-jure-Standard.
Mythos 3: PDF/A unterstützt keine Signaturen
Ganz im Gegenteil. PDF/A erlaubt sogar eingebettete Signaturen – bis hin zur qualifizierten Elektronischen Signatur. Der Signatur-Hersteller muss die Signatur dafür lediglich mit seinem Produkt PDF/A-konform anbringen, aber hier gibt es in der Praxis noch Signaturanbieter, die das noch nicht mit Ihren Produkten beherrschen
Mythos 4: PDF/A erlaubt keine Kompression
Falsch. PDF/A erlaubt alle gängigen Kompressions-Schemata wie JBIG2, JPEG, etc. Ausnahme ist LZW, wo zur Zeit der Standardisierung noch Patente gültig waren. Aus diesen zeitlichen Gründen ist auch JPEG2000 noch nicht in PDF/A-1 eingeflossen, kommt dafür aber in der neuen Version, also mit PDF/A-2.
Mythos 5: PDF/A erlaubt keine OCR für gescannte Dokumente
Falsch. OCR ist sowohl in PDF/A-1b als natürlich auch in PDF/A-1a erlaubt. Kleine Spezialität – und vielleicht Ursache der Verwirrung– ist die Ausnahme, dass dieser unsichtbare Font nicht eingebettet sein muss.
Mythos 6: PDF/A-Dateien werden wegen Font-Einbettung zu groß
Ja und Nein. Richtig ist, dass Fonts (außer OCR) eingebettet werden müssen. Das ist aufgrund der praktischen Erfahrungen nur in dem speziellen Anwendungsgebiet Massen-Ausgangspost ggf. ein Problem. In diesem Bereich kann man mit Font-Reduzierung und Subsetting arbeiten oder pragmatisch und unternehmensindividuell auf die Font-Einbettung verzichten. Diese Dateien sind dann nach „reiner Lehre“ keine PDF/As mehr. Es bleiben aber – bis auf die bewusste Ausnahme – alle Vorteile von PDF/A erhalten.
Mythos 7: PDF/A erlaubt keine Metadaten
Im Gegenteil. Gerade durch XMP sind standardisierte Metadaten in PDF/A möglich. Metadaten können, wie bisher, in den umgebenden Systemen verwaltet werden. Ein Vorteil von PDF/A ist, dass diese auch untrennbar in das Dokument eingebettet werden können.
Mythos 8: PDF/A wird nicht von DMS-Systemen unterstützt
Ja und Nein. Einfach gesagt, kann ein ECM-System auch gut PDF/A unterstützen, das mit PDF umgehen kann. Es gibt aber (leider) noch eine Reihe von DMS-Herstellern, die auf ihre ausgereizten TIFF-Viewer setzen, und das kann in der Praxis manchmal wirklich ein „Hemmschuh“ sein.
Mythos 9: PDF/A wird nur von einer kleinen Gruppe hiesiger Anbieter gefördert
Ganz falsch! Es ist sicher richtig, dass PDF/A im deutschsprachigen Raum zuerst – auch durch die Gründung des PDF/A Competence Center in Deutschland – angenommen wurde. Mittlerweile gibt es in vielen Ländern und Branchen Empfehlungen oder sogar gesetzliche Vorgaben für PDF/A. By the way: Das PDF/A Competence Center hat inzwischen über 100 Mitglieder aus circa 20 Ländern!
Mythos 10: PDF/A ist teuer!
Ja und nein. Sicher erfordert der Einsatz von PDF/A-Werkzeugen erst einmal Investitionen. Manchmal lässt sich der ROI durch hochkomprimierte PDF/A-Dateien innerhalb weniger Monate sogar ohne Excel ausrechnen, wie z. B. im Sparkassen-Bereich. Aber das ist vielleicht eher die Ausnahme. Das Problem dabei ist die Bewertung der Vorteile: Denn wie viel ist es wert, wenn durch Format-Vereinheitlichung Schulungsaufwand und Gebühren für Viewer-Lizenzen eingespart werden und in der Zukunft weniger Migrationen notwendig sind? Und nicht zuletzt: Wie bewertet man ein dank standardisierter PDF/A Dateien „gutes“ Archiv?
Frage: Ich habe eine sehr große Menge an Dokumenten, die wichtige Informationen enthalten und die ich mindestens zehn Jahre aufbewahren muss. Soviel ich weiß, ist PDF/A das beste Format für die Langzeitarchivierung. Kann ich alle meine Dokumente mit dem PDF Compressor Enterprise in hochkomprimierte PDF/A Dokumente verwandeln und diese im Volltext durchsuchbar machen?
Antwort: Ja, PDF/A ist ein ISO-standardisiertes Format und tatsächlich das beste Format für die Langzeitarchivierung! Mit PDF/A ist gewährleistet, dass Dokumente in einem Format archiviert sind, mit dem ihre Verfügbarkeit und Lesbarkeit erhalten bleiben – unabhängig davon, mit welchem Programm oder System sie ursprünglich erzeugt wurden. Und ja, der PDF Compressor Enterprise ist das richtige Werkzeug für Sie, denn er verbindet unsere preisgekrönte Mixed-Raster-Content (MRC Layer-Verfahren) Kompressionstechnologie mit der OCR-FineReader-Technologie von ABBYY. Durch den PDF Compressor Enterprise werden Ihre Dokumente im Stapelverfahren in hochkomprimierte PDF/A Dokumente umgewandelt, welche darüber hinaus dann im Volltext durchsuchbar sind. Die Dokumente belegen dann nur noch sehr wenig Speicherplatz bleiben aber durch das PDF/A Format langfristig lesbar.
Frage:
Hallo! Wir sind Scandienstleister und möchten Ihren PDF Compressor Enterprise bei einer Kundenausschreibung (Scanprojekt) anbieten. Allerdings würde ich vorher gerne die Projektlaufzeit ermitteln. Welche Angaben benötigen Sie, um mir sagen zu können, wie lange ich brauche um alle gescannten Seiten mit dem PDF Compressor Enterprise nach PDF/A zu konvertieren und zu komprimieren?
Antwort:
Guten Tag. Nun, man kann tatsächlich nicht pauschal sagen, wie lange Sie für die Bearbeitung pro Seite brauchen, da das von unterschiedlichen Faktoren abhängt. Zu diesem Zweck haben wir eine kleine Tabelle entwickelt, die die wichtigsten Eckdaten unserer Kunden abfragt und somit eine schnellstmögliche Beantwortung der Anfragen ermöglichen soll.
Sobald wir diese Angaben haben, rechnen wir Ihnen gerne aus, wie viel Zeit Sie für Ihr Projekt benötigen und, wenn Sie eine feste Zeitvorgabe haben, wie viele CPU Cores Sie dann sinnvollerweise nutzen sollten. Dadurch wird auch eine bessere Beratung hinsichtlich unserer Lizenzmodelle erreicht.
Für mehr Informationen zu unseren flexiblen Lizenzmodellen klicken Sie bitte hier!
Frage:
Guten Tag, ich habe eine Frage zu Ihren Lizenzmodellen. Zurzeit plane ich ein neues Scanprojekt. Dabei sollen alle gescannten Seiten nach PDF/A konvertiert und komprimiert werden. Ich muss ca. 4 Millionen Seiten, zu 95% DIN A4, die übrigen in DIN A0, in Farbe, 24 Bit auf 150 dpi, ohne OCR innerhalb von vier Monaten verarbeiten. Welches Ihrer Lizenzmodelle des PDF Compressor Enterprise würde da am besten zu passen?
Antwort:
Zunächst einmal empfehlen wir Ihnen in 200-300dpi zu scannen, bei 150dpi geht die Qualität doch deutlich zurück. Die Dateigrößen sind aber später als Resultat unserer Kompression nur unwesentlich größer, egal ob 150 oder 300 dpi.
Auf 200dpi gerechnet (150 wäre dann höchstens schneller) bedeutet das:
4.000.000 Seiten in vier Monaten ergibt 1.000.000 pro Monat. Davon liegen 5% in DIN A0 und der Rest in DIN A4 vor. 50.000 DIN A0 Seiten entsprechen 800.000 DIN A4 Seiten(äquivalent). Das heißt, dass 1.750.000 Mio. Seiten monatlich für die Ermittlung der Rechenzeit herangezogen werden müssen. Bei Ihren Bedingungen (Farbe, 24 Bit auf 200 DPI, ohne OCR) schafft ein CPU Kern etwa 1.670.000 Seiten pro Monat. Mit noch nötigem „Sicherheitsaufschlag“, würden wir Ihnen daher die Nutzung von 2 CPU Kernen empfehlen.
Es gibt nun zwei Möglichkeiten. Entweder Sie wählen den PDF Compressor Enterprise im Lizenzmodell Basic für 20.000 Seiten mit einer zusätzlichen Cartriges für 4.000.000 Seiten. Dabei ist nur die Basiclizenz investiert und die Seiten sind ein einmaliges „Verbrauchsmaterial“.
Hier ist der große Vorteil, dass alle CPU-Kerne eines Rechners genutzt werden. Das bedeutet viel Sicherheit bezüglich der Rechenzeit, wenn die Lizenz z.B. auf einem Quadcore-Rechner installiert wird. Außerdem ist der Support hier inklusive.
Die zweite Möglichkeit wäre der PDF Compressor Enterpriseim Lizenzmodell Server. Wie gesagt, würden wir Ihnen die Lizenz für zwei CPU Cores empfehlen. Der jährliche Support käme dann zwar extra dazu, dafür hätten Sie aber eine zeitlich und mengenmäßig unlimitierte Lizenz in den Folgejahren, die Sie zum Beispiel für andere Projekte einsetzen können.
Für mehr Informationen zu unseren flexiblen Lizenzmodellen klicken Sie bitte hier!
Frage:
Ich habe eine große Anzahl von gescannten Dokumenten in einer hierarchischen Ordnerstruktur. Ein Ordner beinhaltet diverse Unterordner für jeden einzelnen Kunden. Ist es möglich mit dem PDF Compressor alle Dokumente so zu komprimieren, dass diese Ordnerstruktur mit allen Unterordnern erhalten bleibt?
Antwort:
Das ist kein Problem. Wählen Sie im PDF Compressor bei den Job-Einstellungen unter „ ISO Standard Input“ einfach die Option “Include subfolders“. So werden mit dem PDF Compressor alle Dokumente komplett komprimiert und die hierarchische Ordnerstruktur bleibt erhalten und wird mit in den Ausgangsordner übernommen.
Frage:
Hallo, was mache ich mit meinen MS-Office Dokumenten? Kann ich die auch stapelweise nach PDF/A konvertieren?
Antwort:
Ja, Ihre digital erzeugten Dokumente können Sie jetzt auch genau wie gescannte Dokumente, ganz einfach stapelweise nach PDF/A konvertieren und damit für die Langzeitarchivierung optimal vorbereiten. Mit dem Modul „Born Digital Option“, das zu unserem PDF Compressor Enterprise erhältlich ist, können alle digital erzeugten Dokumente aus MS-Office, Outlook eMails mit Anhängen und elektronisch erstellte PDFs bearbeitet und nach PDF oder PDF/A konvertiert werden. Das Modul „Born Digital Option“ ist zu allen verfügbaren Lizenzmodellen Basic, Advanced und Server erhältlich.
Für eine kostenlose Demoversion unseres Born Digital Modules klicken Sie bitte hier!
Frage:
Ich möchte gerne 100.000, gescannte Einzelseiten im TIFF Format mit dem PDF Compressor nach PDF/A konvertieren und komprimieren und dabei auch die Texterkennung (OCR) anwenden.
Denken Sie, dass ein PC mit Windows XP™ und einem 1,8 GHz Dual-Core CPU-Kern und 2 GB Arbeitsspeicher dafür ausreichend ist oder würden Sie mir für optimale Effizienz etwas anders empfehlen?
Antwort:
Der PDF Compressor profitiert ganz klar von einem schnellen CPU-Kern. Daher würde ich empfehlen, einen Computer mit mehr als 2 GHz zu benutzen. Außerdem kommt es dem der PDF Compressor natürlich zugute, wenn möglichst wenig andere Anwendungen gleichzeitig auf dieser CPU laufen.
Auf einem Multi-Core Computer nutzt der PDF Compressor nur die Anzahl der Prozessorkerne, für die er lizensiert ist. Für einen Computer mit zwei CPU Kernen können Sie also entweder eine Single-Core oder Dual-Core Lizenz erwerben. Letzeres ermöglicht die gleichzeitige Durchführung von zwei Kompressions-Jobs, was dazu führt, dass Sie Ihren Durchsatz beinahe verdoppeln.
2 GB Arbeitsspeicher sollten für Ihre Zwecke ausreichend sein, wenn die übrigen Anwendungen auf Ihrem PC nicht zu viel Speicherplatz belegen. Wir empfehlen 2 GB pro (lizensiertem) CPU-Kern für den PDF Compressor.
Frage:
Was ist der Unterschied zwischen PDF und PDF/A?
Antwort:
PDF/A basiert auf dem PDF Format. Im Gegensatz zu dem herkömmlichen PDF Format, wurde der PDF/A ISO-Standard zur Langzeitarchivierung elektronischer Dokumente konzipiert. Damit bleibt die visuelle Darstellung elektronischer Dokumente erhalten, unabhängig davon, mit welchem Werkzeug oder System sie ursprünglich erstellt bzw. gespeichert wurden. Der PDF/A-Standard definiert keine Archivstrategie oder Ziele eines Archivsystems, sondern ist ein "Profil" für elektronische Dokumente, mit dem diese über lange Jahre hinweg reproduzierbar bleiben.
Für mehr Informationen, klicken Sie bitte hier.