meta data for this page
Differences
This shows you the differences between two versions of the page.
| Both sides previous revision Previous revision Next revision | Previous revision | ||
|
docker_-_automatisierte_scan-verarbeitung [2018/07/04 10:35] 192.168.47.202 [3. syno-ocr] |
— (current) | ||
|---|---|---|---|
| Line 1: | Line 1: | ||
| - | ====== Docker - automatisierte Scan-Verarbeitung ====== | ||
| - | ===== 1. Allgemeines ===== | ||
| - | |||
| - | Die bei uns eingesetzten Server Synology NAS lassen eine gewisse Verarbeitung auf Command line Ebene zu. Das hat aber Grenzen, besonders, wenn für die Ausführung irgendwelches Debian-Packages oder sonstigen Tools geladen werden müssen. Das KOENNTE man zwar mittels IPKG-Pakete irgendwie hinkriegen, aber das führt dazu, dass bei jedem Update von Synology gezittert werden muss, ob es noch läuft. | ||
| - | |||
| - | DOCKER bietet eine kleine virtuelle Umgebung an, inder wir eine Software laufen lassen können. | ||
| - | |||
| - | Die OCR-Erkennung der gescannten PDF ist so ein Beispiel. Sie benötigt tesseract, pdftk, zbarimg etc., und zwar möglichst in der allerneusten Version, damit es am besten funktioniert. | ||
| - | |||
| - | In Docker arbeitet man mit Images, die entweder allgemeingültig sind oder von uns angelegt wurden (User planbee). | ||
| - | Damit wir Systemumgebung und Programm auseinanderhalten, | ||
| - | |||
| - | * '' | ||
| - | * '' | ||
| - | |||
| - | |||
| - | ===== syno-debian-ocr ===== | ||
| - | Im Januar 2018 wurde die Umgebung auf das neuste, unstable Debian-SID aktualisiert, | ||
| - | Die Umgebung wurde so aufgebaut: | ||
| - | |||
| - | < | ||
| - | # 1. Hole das Image debian-sid | ||
| - | docker pull debian: | ||
| - | # 2. Starte den Container mit einem Prompt | ||
| - | docker run -ti --entrypoint=bash --name debian debian: | ||
| - | # 4. Installiere tesseract-ocr und alle anderen benötigten Tools: | ||
| - | apt-get update | ||
| - | apt-get -y install tesseract-ocr tesseract-ocr-deu poppler-utils zbar-tools pdftk nano | ||
| - | exit | ||
| - | # 5. Speichere den aktuellen Container als neues Repository-Image | ||
| - | docker login | ||
| - | docker commit debian planbee/ | ||
| - | docker push planbee/ | ||
| - | </ | ||
| - | |||
| - | =====3. syno-ocr===== | ||
| - | |||
| - | Im Syno-ocr sind die Scripts für die Verarbeitung enthalten. | ||
| - | Die Scripts prüfen alle /src* - Verzeichnisse und verarbeiten die Dateien von /srcXXX nach /dstXXX | ||
| - | |||
| - | < | ||
| - | # um ein neues Image anhand des aktuellen Verzeichnisses anzulegen: | ||
| - | docker build -t planbee/ | ||
| - | |||
| - | # um einen Container zu erstellen auf dem Image | ||
| - | docker create \ | ||
| - | --volume / | ||
| - | --volume / | ||
| - | --volume / | ||
| - | --name ocrpdf planbee/ | ||
| - | |||
| - | # oder einen Test-Container | ||
| - | docker run -ti --entrypoint=/ | ||
| - | --volume / | ||
| - | --name ocrtest planbee/ | ||
| - | |||
| - | |||
| - | # um diesen Container zu starten | ||
| - | docker start ocrtest | ||
| - | |||
| - | # um diesen Container zu stoppen | ||
| - | docker stop ocrtest | ||
| - | |||
| - | # um diesen Container zu löschen | ||
| - | docker rm ocrtest | ||
| - | |||
| - | # um das ganze Image vom Rechner zu killen | ||
| - | docker rmi planbee/ | ||
| - | |||
| - | </ | ||
| - | |||
| - | |||
| - | |||
| - | ===== Aufbau des Debian-SID Basis-Images ===== | ||
| - | |||
| - | < | ||
| - | # 1. Hole das Image debian-sid | ||
| - | docker pull debian: | ||
| - | # 2. Erstelle einen Container dafür | ||
| - | docker create --name debian debian: | ||
| - | # 3. Starte den Container mit einem Prompt | ||
| - | docker run -ti --entrypoint=bash debian: | ||
| - | # 4. Installiere tesseract-ocr und alle anderen benötigten Tools: | ||
| - | apt-get update | ||
| - | apt-get -y install tesseract-ocr tesseract-ocr-deu poppler-utils zbar-tools pdftk | ||
| - | exit | ||
| - | # 5. Speichere den aktuellen Container als neues Repository-Image | ||
| - | docker login | ||
| - | docker commit debian planbee/ | ||
| - | docker push planbee/ | ||
| - | |||
| - | |||
| - | </ | ||