Forum: PC Hard- und Software Automatisches OCR für Nextcloud?


von MeineCloud (Gast)


Lesenswert?

Guten Abend,
ich habe mir letztes Wochenende eine Nextcloud eingerichtet und bin sehr 
zufrieden. Was mir allerdings noch fehlt ist eine automatische OCR bzw. 
Indizierung. Auf der Cloud liegen jeden Menge alte Scans in .tif Format 
sowie PDF-Dateien ohne Texterkennung.
Kann mir jemand sagen, wie ich in der Nextcloud alle Dateien automatisch 
indizieren lassen kann oder beim hochladen automatisch von einer OCR App 
erkennen lassen kann?
Besten Dank
Jen

von tesseract (Gast)


Lesenswert?


von ozo (Gast)


Lesenswert?


von R0Wi (Gast)


Lesenswert?

Eventuell auch interessant: https://github.com/R0Wi/workflow_ocr

Basiert auf der Nextcloud Workflow Engine, prozessiert Dateien 
serverseitig per ocrmypdf und ist voll kompatibel zur 
Fulltextsearch-App, da die Dateien zu PDFs umgewandelt und mit OCR-Layer 
versehen werden und danach voll indexierbar sind. Bin der 
Hauptentwickler des Projekts und setze die App auch privat ein, da ich 
ähnliche Anforderungen an Nextcloud habe.

Grüße

Robin

Bitte melde dich an um einen Beitrag zu schreiben. Anmeldung ist kostenlos und dauert nur eine Minute.
Bestehender Account
Schon ein Account bei Google/GoogleMail? Keine Anmeldung erforderlich!
Mit Google-Account einloggen
Noch kein Account? Hier anmelden.