Mac OS X – Scananwendung VueScan, OCR in Deutsch

Die Oberfläche der tollen Scan-Anwendung VueScan (siehe vorherigen Blog-Eintrag) ist problemlos in Deutsch nutzbar. Die Professional Version bietet aber auch die Möglichkeit, Texte zu erkennen und dann als Text-Datei oder in einem PDF mit abzuspeichern, was die Suche nach eingescannten Texten deutlich erleichtert.

Leider geht das von Werk aus nicht in Deutsch, und die Einstellung die hierfür nötig ist, ist auf der Homepage vom Hersteller Hamrick Software nur unzureichend beschrieben, zumindest was die Mac-Version angeht.

Darum hier eine ausführliche Anleitung.

Zunächst muss VueScan gestartet werden und in den Professional Modus gewechselt werden.

VueScan Professional

Nun wechselt man auf die Registerkarte „Ergebnis“. Hier am besten erstmal „PDF“ auswählen, damit die Optionen so aussehen wie in meinem Screenshot, dann „PDF-OCR-Text“ aktivieren und im Feld „OCR-Text-Sprache“ den untersten Eintrag „Mehr“ auswählen. Man landet nun auf der Download-Seite für die optionalen OCR-Sprachpakete.

VueScan OCR

Von der Download-Seite ist nun die Datei „ocr_de.bin“ herunterzuladen. Diese landet standardmäßig im Download-Ordner von Mac OS X. Nun müssen wir die Datei noch in den richtigen Ordner kopieren. Hierzu einfach ein Finder-Fenster öffnen, oben im Menü auf „Gehe zu / Computer“ klicken, dann die lokale Festplatte öffnen und darin zum Ordner „Benutzer“ und dann „Für alle Benutzer“ navigieren. In genau diesen Ordner muss die Datei nun hineinkopiert werden.

Mac OS X Finder

Nach einem Neustart der Anwendung VueScan kann nun Deutsch als OCR-Sprache ausgewählt werden.

VueScan OCR Deutsch

Ganz toll ist diese Funktion beim Einscannen von PDF-Dokumenten. Zum einen kann nun nach dem Text in den Dokumenten gesucht werden, da hinter der Grafik auch der wirkliche Text liegt. Zum anderen kann man den Text markieren und über die Zwischenablage herauskopieren. Die Erkennungsquote ist gut, aber leider nicht perfekt.

 

 

Schreiben Sie einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert.