Änderungen

Zur Navigation springen Zur Suche springen
1.819 Bytes hinzugefügt ,  11:03, 6. Apr. 2023
Zeile 13: Zeile 13:     
== PDF ==
 
== PDF ==
 +
 +
=== Mini-Dokumentenmanagementsystem ===
 +
 +
* Status: Idee
 +
* Ziel: Einfache Volltextsuche auch gescannter Dokumente
 +
* Unterziele:
 +
** Keine Bindung an das Projekt, leichter Umstieg auf ein anderes (richtiges) [[DMS]]
 +
** Nutzung bisheriger Ordnerstruktur
 +
* Umsetzung
 +
** Es wird ein Erfassungs-Workflow geschaffen
 +
*** Schritt 1: Sofern das Dokument in Papier vorliegt, muss es
 +
**** gescannt
 +
**** und per OCR erfasst werden
 +
**** Es wird ein PDF in der bestehenden Ordnerstruktur erzeugt, das einen Textlayer hat.
 +
*** Im Schritt 2 wird eine Text-Datei erzeugt,
 +
**** die den kompletten Textinhalt der Datei enthält und
 +
**** die im selben Ordner wie die Originaldatei liegt und
 +
**** die als Dateinamen den Namen der ursprünglichen Datei einschließlich Endung mit der zusätzlichen Endung ".mdms.txt" erhält
 +
** Es gibt ein Suchskript über die .mdms.txt-Dateien
 +
*** Basis wahrscheinlich [https://svij.org/blog/2017/03/08/suchen-und-finden-mit-ag-statt-ack-statt-grep/ ag] statt ack oder grep (in Kombination mit find)
 +
*** dies kann optional die gefundenen Dateien öffnen
 +
**** xdg-open in Verbindung mit dem Dateinamen der mdms.txt-Datei, jedoch ohne .mdms.txt
 +
* Erweiterungen
 +
** Es werden nicht nur Scanns erfasst, sondern auch bestehende Dokumente, z.B.
 +
*** mittels pdftotext bei PDFs, die aus einer Textverarbeitung stammen (also kein OCR benötigen)
 +
*** DOC, DOCX, ODS, ODT-Dateien
 +
** Es braucht ein Erfassungsskript, das die mdms.txt-Dateien anlegt.
 +
** Bei in Textform bereits vorliegenden Formaten, braucht es keine mdms.txt-Dateien. Insoweit muss das Suchskript lediglich erweitert werden. Beispiele
 +
*** Programmcode wie .js, .ts, .c , .cpp, .rs, .html
 +
*** Markup wie Markdown .md, .markdown und Asciidoc .adoc
 +
* Alternativen
 +
** openpaper PaperWorks
 +
*** unterstützt leider die bisherige Ordnerstruktur nicht.
 +
 +
 +
    
=== Füge PDF in Word-Dokument ein ===
 
=== Füge PDF in Word-Dokument ein ===

Navigationsmenü