Zeile 363: |
Zeile 363: |
| * Um eine komplette Open Source-Lösung für DMS zu erreichen, bedarf es eines [http://www.claraocr.org/de/ocr/ocr-software/open-source-ocr.html Open Source OCR]. | | * Um eine komplette Open Source-Lösung für DMS zu erreichen, bedarf es eines [http://www.claraocr.org/de/ocr/ocr-software/open-source-ocr.html Open Source OCR]. |
| ** [http://www.openkm.com/ OpenKM] verspricht ein [[Open Source]]-[[DMS]] zu sein, das auch [[OCR]] integriert. | | ** [http://www.openkm.com/ OpenKM] verspricht ein [[Open Source]]-[[DMS]] zu sein, das auch [[OCR]] integriert. |
− | ** Mit einer Kette aus ImageMagick und Tesseract lässt sich [http://kaffeeringe.de/2942/ocr-mit-tesseract-und-imagemagick/ das papierlose Büro angeblich] beginnen. | + | ** Mit einer Kette aus [[ImageMagick]] und [[Tesseract]] lässt sich [http://kaffeeringe.de/2942/ocr-mit-tesseract-und-imagemagick/ das papierlose Büro angeblich] beginnen. |
| + | ** Auch [[Cuneiform]] scheint eine recht zuverlässige Open-Source-[[OCR]] zu sein. |
| ** Mit [http://wiki.ubuntuusers.de/ExactImage#hocr2pdf hocr2pdf] können Sandwich-PDFs erstellt werden: markierbarer/durchsuchbarer Text auf Bild. Der Text muss dazu im hOCR-Format vorliegen, was u.a. [[Tesseract]] beherrscht. | | ** Mit [http://wiki.ubuntuusers.de/ExactImage#hocr2pdf hocr2pdf] können Sandwich-PDFs erstellt werden: markierbarer/durchsuchbarer Text auf Bild. Der Text muss dazu im hOCR-Format vorliegen, was u.a. [[Tesseract]] beherrscht. |
| ** Mit [http://tika.apache.org/ Apache Tika] lassen sich die Metadaten und der Inhalt eines Dokuments getrennt erfassen. | | ** Mit [http://tika.apache.org/ Apache Tika] lassen sich die Metadaten und der Inhalt eines Dokuments getrennt erfassen. |
Zeile 375: |
Zeile 376: |
| * [http://www.agorum.com/startseite/produkte/dms-ecm-agorum-core-open-source/schnellvergleich-agorum-core-versionen.html Agorum core] | | * [http://www.agorum.com/startseite/produkte/dms-ecm-agorum-core-open-source/schnellvergleich-agorum-core-versionen.html Agorum core] |
| | | |
− | * [http://www.archivista.ch/de/pages/support/downloads.php Archivista] | + | * [http://www.archivista.ch/de/pages/support/downloads.php Archivista] (auch mit umfangreichem [http://www.archivista.ch/de/pages/support/handbuch.php Handbuch]) |
| | | |
| ==== Reporting ==== | | ==== Reporting ==== |