Zeile 13: |
Zeile 13: |
| | | |
| == PDF == | | == PDF == |
| + | |
| + | === Mini-Dokumentenmanagementsystem === |
| + | |
| + | * Status: Idee |
| + | * Ziel: Einfache Volltextsuche auch gescannter Dokumente |
| + | * Unterziele: |
| + | ** Keine Bindung an das Projekt, leichter Umstieg auf ein anderes (richtiges) [[DMS]] |
| + | ** Nutzung bisheriger Ordnerstruktur |
| + | * Umsetzung |
| + | ** Es wird ein Erfassungs-Workflow geschaffen |
| + | *** Schritt 1: Sofern das Dokument in Papier vorliegt, muss es |
| + | **** gescannt |
| + | **** und per OCR erfasst werden |
| + | **** Es wird ein PDF in der bestehenden Ordnerstruktur erzeugt, das einen Textlayer hat. |
| + | *** Im Schritt 2 wird eine Text-Datei erzeugt, |
| + | **** die den kompletten Textinhalt der Datei enthält und |
| + | **** die im selben Ordner wie die Originaldatei liegt und |
| + | **** die als Dateinamen den Namen der ursprünglichen Datei einschließlich Endung mit der zusätzlichen Endung ".mdms.txt" erhält |
| + | ** Es gibt ein Suchskript über die .mdms.txt-Dateien |
| + | *** Basis wahrscheinlich [https://svij.org/blog/2017/03/08/suchen-und-finden-mit-ag-statt-ack-statt-grep/ ag] statt ack oder grep (in Kombination mit find) |
| + | *** dies kann optional die gefundenen Dateien öffnen |
| + | **** xdg-open in Verbindung mit dem Dateinamen der mdms.txt-Datei, jedoch ohne .mdms.txt |
| + | * Erweiterungen |
| + | ** Es werden nicht nur Scanns erfasst, sondern auch bestehende Dokumente, z.B. |
| + | *** mittels pdftotext bei PDFs, die aus einer Textverarbeitung stammen (also kein OCR benötigen) |
| + | *** DOC, DOCX, ODS, ODT-Dateien |
| + | ** Es braucht ein Erfassungsskript, das die mdms.txt-Dateien anlegt. |
| + | ** Bei in Textform bereits vorliegenden Formaten, braucht es keine mdms.txt-Dateien. Insoweit muss das Suchskript lediglich erweitert werden. Beispiele |
| + | *** Programmcode wie .js, .ts, .c , .cpp, .rs, .html |
| + | *** Markup wie Markdown .md, .markdown und Asciidoc .adoc |
| + | * Alternativen |
| + | ** openpaper PaperWorks |
| + | *** unterstützt leider die bisherige Ordnerstruktur nicht. |
| + | |
| + | |
| + | |
| | | |
| === Füge PDF in Word-Dokument ein === | | === Füge PDF in Word-Dokument ein === |