Linux Bibel online ~ Scannen & OCR

Creative Commons Lizenzvertrag
Dieses Werk ist lizenziert unter einer Creative Commons Namensnennung - Nicht-kommerziell - Weitergabe unter gleichen Bedingungen 3.0 Österreich Lizenz.

Change language by Google translator: ...

Drucken und Scannen ist unter Linux meist weniger ein Problem als unter Microsoft Windows, auch in Dingen optischer Texterkennung wird die Lage unter Linux täglich besser. Meist genügt es den Drucker, den Scanner oder das All in One-Gerät einfach nur anzuschließen, nach einigen Sekunden sollte Linux den Drucker, Scanner ober beides in einem erkannt haben und er sollte sich in den Einstellungen der jeweiligen Desktop-Umgebung - hier unter den Systemeinstellungen unter KDE wieder finden:

Drucken, Scannen und OCR unter Linux - Drucker einrichten

Drucken, Scannen und OCR unter Linux - Drucker einrichten

Ist dies nicht der Fall fehlt dann doch der entsprechende Treiber - wie Sie den passenden finden lesen Sie unter Treiber unter Linux.

Über das Drucken muss ich wohl nicht viel schreiben, es funktioniert wie unter Windows auch, Dokument öffnen und auf "Drucken" klicken, den Drucker auswählen und die Geschichte hat sich erledigt - haben Sie ein Gerät von Hewlett Packard können Sie zusätzlich über die Paket-Verwaltung das Paket "hplip-gui" installieren das eine zusätzliche grafische Oberfläche für alle Geräte dieses Herstellers mit sich bringt - diese starten Sie nach der Installation ganz einfach aus dem Anwendungsmenü (Bereich "System / HPlip-Toolbox") heraus, das Icon legt sich in den System-Bereich des Panels oder der Kontrollleiste unter KDE:

Drucken, Scannen und OCR unter Linux - Hewlett Packard

Drucken, Scannen und OCR unter Linux - Hewlett Packard

Aber ehrlich gesagt - mehr als grafischer unnötiger Klimbim für Windows-Nutzer ist die Software nicht, Sie können daraus Aktionen starten wie Drucken, Scannen und einige Status-Informationen lesen.

Nicht immer funktioniert die Erkennung eines Druckers zu 100 Prozent richtig, wird der Drucker, der Scanner oder das Multifunktionsgerät trotz installierter Treiber wirklich nicht erkannt hilft die Web-Oberfläche des Druck-Systems CUPS weiter die Sie über den Webbrowser öffnen indem Sie die Adresse "http://localhost:631" eingeben:

Drucken, Scannen und OCR unter Linux - Xsane - CUPS auf der Web-Oberfläche

Drucken, Scannen und OCR unter Linux - Xsane - CUPS auf der Web-Oberfläche

Hier fügen Sie ganz einfach über den Webbrowser Drucker und Multifunktionsgeräte hinzu selbst wenn diese nicht automatisch vom System erkannt wurden die dann auch funktionieren.

In diesem Beitrag geht es also weniger um das Drucken sondern mehr um das Scannen und natürlich auch die optische Texterkennung.

Scannen

Wie schon beschrieben - Scanner anschließen, einige Sekunden warten - der Scanner oder das All in One-Gerät sollte erkannt werden, ansonsten muss man sich um den passenden Treiber kümmer was aber auch nicht sonderlich schwierig ist (wie oben beschrieben). Zum Scannen selbst findet sich unter den großen Desktop-Umgebungen wie KDE, GNOME und Unity meist schon die passende Software - suchen Sie im Anwendungsmenü einfach nach "scan", meist im Bereich "Grafik" zu finden. Die vor installierte Software ist meist sehr einfach gehalten und bietet nicht sonderlich viele Optionen - für einfache Dinge durchaus zu gebrauchen:

Drucken, Scannen und OCR unter Linux - Drucker einrichten - Skanlite

Drucken, Scannen und OCR unter Linux - Skanlite

Geben Sie die passenden Optionen ein, klicken auf "Vorschau", wählen wenn nötig den passenden Bereich und klicken auf "Scannen" und Sie werden gefragt unter welchen Namen die Datei wohin gespeichert werden soll. Wie schon beschrieben - nicht sonderlich viele Optionen, will man dann doch etwas mehr sollte man sich über die Paket-Verwaltung ganz einfach die Software "xsane" installieren - will man direkt über den Scan optische Texterkennung durchführen hat man sowieso keine andere Wahl als diese Software zu installieren.

Xsane - professionell scannen

Nach der Installation finden Sie die Software im Anwendungsmenü im Bereich "Grafik", alternativ starten Sie über den Schnellstarter (Alt + F2) oder über das Terminal durch den Befehl:

xsane

Die Software startet nur wenn der Scanner auch angeschlossen und der passende Treiber installiert ist (Treiber):

Drucken, Scannen und OCR unter Linux - Drucker einrichten - Xsane

Drucken, Scannen und OCR unter Linux - Xsane

Die Software startet wie man sieht drei Fenster - dies mag zwar verwirren schafft tatsächlich aber mehr Übersichtlichkeit. Links finden Sie das Fenster Xsane das die eigentlichen Optionen bietet, in der Mitte das Histogramm das die Farb-Verteilung zeigt und rechts das Fenster in dem Sie Bereiche zum Scannen auswählen.

Zum Scannen selbst nutzen Sie zum Beginn das Fenster Xsane, wählen Sie unter "Farbe" nun wie Sie scannen möchten, handelt es sich um ein Farb-Bild, um reine Grau-Stufen oder um eine schwarz-weiß-Zeichnung sowie wenn gewünscht die Auflösung darunter. Unter "Typ" wählen Sie die passende Datei-Endung und wenn gewünscht weitere Optionen, wechseln Sie nun ins Fenster Vorschau und klicken auf "Vorschau-Scan":

Drucken, Scannen und OCR unter Linux - Xsane

Drucken, Scannen und OCR unter Linux - Xsane

Wenn gewünscht wählen Sie nun den zu scannenden Bereich aus und treffen weitere Optionen - ist alles wie man es sich vor stellt klickt man im Fenster Xsane auf "Scannen" und die Software scannt den gewünschten Bereich, ist dies geschehen öffnet sich ein weiteres Fenster das anbietet die Datei zu speichern:

Drucken, Scannen und OCR unter Linux - Xsane

Drucken, Scannen und OCR unter Linux - Xsane

Hier lassen sich wenn gewünscht weitere Optionen treffen, einfach auf das Icon mit der Diskette klicken und schon wird die Datei gespeichert.

Optische Texterkennung

Optische Texterkennung bedeutet nichts anderes als beispielsweise eine Text-Seite zu scannen und den darin erhaltenen Text nicht als Bild sondern als Text zu speichern. Bis vor wenig Zeit war dies noch etwas kritisch unter Linux, doch selbst unter Windows ist diese Art der Software alles andere als perfekt - solche Software zu entwickeln dauert massenhaft an Zeit, es gibt viele unterschiedliche Schriften und so weiter und so fort. Doch auch unter Linux hat sich hier viel getan, es steckt nicht mehr so viel an mehr-Arbeit dahinter wie zuvor.

Zu Beginn benötigt man die richtige Software, es gibt solche für das Terminal - diese lässt sich auch gleich in Xsane integrieren und es gibt solche die man extra installiert - man scannt und speichert die Datei die man wiederum mit der Text-Erkennung öffnet.

Tipp: Scannen Sie Dateien zur Texterkennung möglichst in Grau-Stufen und in einem Format das zwar etwas größere Dateien schafft dafür aber sehr gute Qualität bietet - etwa Tiff.

Die einfachste Art optischer Texterkennung unter Linux ist nun mittels externer Software, installieren Sie einfach über die Paket-Verwaltung die Pakete "tesseract-ocr-deu" sowie weitere Pakete der Sprachen die die Software erkennen soll - in diesem Fall wäre es einfach deutsch, zusätzlich installiert man sich die grafische Oberfläche durch das Paket "gimagereader". Die Software findet sich nach der Installation im Anwendungsmenü im Bereich "Grafik", alternativ startet man wie immer über den Schnellstarter (Alt + F2) oder über das Terminal durch den Befehl:

gimagereader

Drucken, Scannen und OCR unter Linux - Gimagereader

Drucken, Scannen und OCR unter Linux - Gimagereader

Unter "Dateien" öffnen Sie nun gespeicherte Dateien - etwas unbedarft übersetzt wurde wohl "Erwerben" - hier muss man nichts kaufen sondern man startet damit etwa den Scanner um die Datei von dort zu holen. Nun öffnet man die Datei:

Drucken, Scannen und OCR unter Linux - Gimagereader

Drucken, Scannen und OCR unter Linux - Gimagereader

Und markiert den zu erkennenden Text:

Drucken, Scannen und OCR unter Linux - Gimagereader

Drucken, Scannen und OCR unter Linux - Gimagereader

Wichtig - bei Text mit mehr Spalten immer nur eine Spalte markieren. Klicken Sie nun den Text mit der rechten Maustaste an und wählen "Erkennen", neben der Sprachauswahl klicken Sie auf "Ausgabe-Bereich einblenden":

Drucken, Scannen und OCR unter Linux - Gimagereader

Drucken, Scannen und OCR unter Linux - Gimagereader

Über die Schalter lässt sich der Text direkt in die Zwischenablage kopieren und vieles mehr.

OCR in Xsane

Um unter Xsane direkt Texterkennung durch zu führen installieren Sie über die Paket-Verwaltung das Paket "gocr". Öffnen Sie nun Xsane (mit angeschlossenem Scanner natürlich) und öffnen die Einstellungen im Bereich "Konfiguration / Texterkennung":

Drucken, Scannen und OCR unter Linux - OCR in Xsane

Drucken, Scannen und OCR unter Linux - OCR in Xsane

Hier fügen Sie nun statt "gocr" die Zeile:

gocr -p ~/db

ein, klicken auf "Anwenden" und schließen das Fenster.

Nun startet man erstmalig Gocr auf dem Terminal mit einer eingescannten Text-Seite um die Software ein wenig zu trainieren - besonders geht es um Serifen-Schriften. Als kleines Beispiel habe ich hier die Datei "out.tiff" liegen:

gocr -i out.tiff -o dateiname.txt -m 130

Drucken, Scannen und OCR unter Linux - GOCR

Drucken, Scannen und OCR unter Linux - GOCR

Die Beschwerde:

DB ./db/db.lst not found

lassen Sie links liegen, die Datenbank wird gerade erst angelegt. Gocr zeigt nun auf dem Terminal Zeichen an die es erkannt hat und solche bei denen es nicht geschehen ist, Zeichen die durch "#" angezeigt werden wurden nicht erkannt und solche durch eine "0" angezeigt wurden erkannt. Geben Sie den Buchstaben ein und drücken die Eingabe-Taste, die Software springt weiter zum nächsten nicht erkannten Buchstaben, wiederholen Sie den Vorgang. Dies können auch mehrere Zeichen zur selben Zeit sein. Gocr wird sich solche Zeichen in dieser Schrift merken. Tun Sie dies hin und wieder und die Software wird in der Erkennung von Texten immer besser - vor allem unterschiedliche Schriften nutzen.

Unter Xsane scannen Sie nun die Vorschau, und klicken im Fenster Xsane beim Typ auf "Text", der erkannte Text wird nun in eine Textdatei gespeichert. Wie schon beschrieben Scannen als Grau-Stufe.