| Zeile 13: |
Zeile 13: |
| | | | |
| | == PDF == | | == PDF == |
| | + | |
| | + | === Mini-Dokumentenmanagementsystem === |
| | + | |
| | + | * Status: Idee |
| | + | * Ziel: Einfache Volltextsuche auch gescannter Dokumente |
| | + | * Unterziele: |
| | + | ** Keine Bindung an das Projekt, leichter Umstieg auf ein anderes (richtiges) [[DMS]] |
| | + | ** Nutzung bisheriger Ordnerstruktur |
| | + | * Umsetzung |
| | + | ** Es wird ein Erfassungs-Workflow geschaffen |
| | + | *** Schritt 1: Sofern das Dokument in Papier vorliegt, muss es |
| | + | **** gescannt |
| | + | **** und per OCR erfasst werden |
| | + | **** Es wird ein PDF in der bestehenden Ordnerstruktur erzeugt, das einen Textlayer hat. |
| | + | *** Im Schritt 2 wird eine Text-Datei erzeugt, |
| | + | **** die den kompletten Textinhalt der Datei enthält und |
| | + | **** die im selben Ordner wie die Originaldatei liegt und |
| | + | **** die als Dateinamen den Namen der ursprünglichen Datei einschließlich Endung mit der zusätzlichen Endung ".mdms.txt" erhält |
| | + | ** Es gibt ein Suchskript über die .mdms.txt-Dateien |
| | + | *** Basis wahrscheinlich [https://svij.org/blog/2017/03/08/suchen-und-finden-mit-ag-statt-ack-statt-grep/ ag] statt ack oder grep (in Kombination mit find) |
| | + | *** dies kann optional die gefundenen Dateien öffnen |
| | + | **** xdg-open in Verbindung mit dem Dateinamen der mdms.txt-Datei, jedoch ohne .mdms.txt |
| | + | * Erweiterungen |
| | + | ** Es werden nicht nur Scanns erfasst, sondern auch bestehende Dokumente, z.B. |
| | + | *** mittels pdftotext bei PDFs, die aus einer Textverarbeitung stammen (also kein OCR benötigen) |
| | + | *** DOC, DOCX, ODS, ODT-Dateien |
| | + | ** Es braucht ein Erfassungsskript, das die mdms.txt-Dateien anlegt. |
| | + | ** Bei in Textform bereits vorliegenden Formaten, braucht es keine mdms.txt-Dateien. Insoweit muss das Suchskript lediglich erweitert werden. Beispiele |
| | + | *** Programmcode wie .js, .ts, .c , .cpp, .rs, .html |
| | + | *** Markup wie Markdown .md, .markdown und Asciidoc .adoc |
| | + | * Alternativen |
| | + | ** openpaper PaperWorks |
| | + | *** unterstützt leider die bisherige Ordnerstruktur nicht. |
| | + | |
| | + | |
| | + | |
| | | | |
| | === Füge PDF in Word-Dokument ein === | | === Füge PDF in Word-Dokument ein === |