Änderungen

Zur Navigation springen Zur Suche springen
Zeile 386: Zeile 386:  
=== Geschäftssoftware ===
 
=== Geschäftssoftware ===
 
==== Dokumentenmanagementsystem ====
 
==== Dokumentenmanagementsystem ====
==== Allgemeines ====
+
===== Allgemeines =====
 
* [http://www.heise.de/open/artikel/Dokumentenmanagement-mit-Open-Source-221973.html Einführung in Dokumentenmanagentsystem (DMS)] mit Open Source (heise-Artikel)
 
* [http://www.heise.de/open/artikel/Dokumentenmanagement-mit-Open-Source-221973.html Einführung in Dokumentenmanagentsystem (DMS)] mit Open Source (heise-Artikel)
 
* [http://www.documanager.de/ Portal zu DMS]
 
* [http://www.documanager.de/ Portal zu DMS]
Zeile 395: Zeile 395:  
** Auch [[Cuneiform]] scheint eine recht zuverlässige Open-Source-[[OCR]] zu sein.
 
** Auch [[Cuneiform]] scheint eine recht zuverlässige Open-Source-[[OCR]] zu sein.
 
** Mit [http://wiki.ubuntuusers.de/ExactImage#hocr2pdf hocr2pdf] können Sandwich-PDFs erstellt werden: markierbarer/durchsuchbarer Text auf Bild. Der Text muss dazu im hOCR-Format vorliegen, was u.a. [[Tesseract]] beherrscht.
 
** Mit [http://wiki.ubuntuusers.de/ExactImage#hocr2pdf hocr2pdf] können Sandwich-PDFs erstellt werden: markierbarer/durchsuchbarer Text auf Bild. Der Text muss dazu im hOCR-Format vorliegen, was u.a. [[Tesseract]] beherrscht.
 +
** Die Kombination aus [[Tesseract]] und [https://sourceforge.net/projects/gimagereader/ gImageReader] bietet OCR, hOCR und Sandwich-PDF mit GUI-Unterstützung.<ref>Vgl. https://www.linux-magazin.de/ausgaben/2017/06/bitparade/2/</ref>
 
** Mit [http://tika.apache.org/ Apache Tika] lassen sich die Metadaten und der Inhalt eines Dokuments getrennt erfassen.
 
** Mit [http://tika.apache.org/ Apache Tika] lassen sich die Metadaten und der Inhalt eines Dokuments getrennt erfassen.
 
** Auch [https://www.naps2.com/ Naps2] scheint beim Scannen und anschließendem [[OCR]] zu helfen.
 
** Auch [https://www.naps2.com/ Naps2] scheint beim Scannen und anschließendem [[OCR]] zu helfen.

Navigationsmenü