** [http://www.openkm.com/ OpenKM] verspricht ein [[Open Source]]-[[DMS]] zu sein, das auch [[OCR]] integriert.
** [http://www.openkm.com/ OpenKM] verspricht ein [[Open Source]]-[[DMS]] zu sein, das auch [[OCR]] integriert.
** Mit einer Kette aus ImageMagick und Tesseract lässt sich [http://kaffeeringe.de/2942/ocr-mit-tesseract-und-imagemagick/ das papierlose Büro angeblich] beginnen.
** Mit einer Kette aus ImageMagick und Tesseract lässt sich [http://kaffeeringe.de/2942/ocr-mit-tesseract-und-imagemagick/ das papierlose Büro angeblich] beginnen.
+
** Mit [http://wiki.ubuntuusers.de/ExactImage#hocr2pdf hocr2pdf] können Sandwich-PDFs erstellt werden: markierbarer/durchsuchbarer Text auf Bild. Der Text muss dazu im hOCR-Format vorliegen, was u.a. [[Tesseract]] beherrscht.