Anständige Freeware zur Texterkennung

Makita · 11.08.2009

Guten Tag, emsige Autoren,

kennt jemand von Euch ein kostenloses Programm zur Texterkennung, das auch etwas taugt? Ich will einen Berg Schrift auf Altpapier einscannen und bin da gestern stundenlang dran verzweifelt; entweder wollen die Programme gekauft sein, oder sie erkennen kein Deutsch, oder sie laufen nach wenigen Scans ab. Eines, das dreißig Tage lang als Vollversion zu laufen verprach, spuckte nur rätselhafte Zeichenkolonnen aus.
Vielleicht gibt's das ja auch einfach nicht, dann muß ich eben alles eintippen, aber natürlich hoffe ich jetzt auf den Link des Jahrhunderts von Euch. Make my day!

Makita.

Berg · 11.08.2009

Hi Makita,

wenn Du eine schnelle Internetverbindung hast, versuch:
http://www.free-ocr.com/

Makita · 11.08.2009

Hehe. Das ist nicht schlecht! In der Form erkennt er zumindest generell mal Deutsch. Ich hatte mir freeOCR heruntergeladen, aber da wollte er nur Englisch und Spanisch erkennen.
Hier mein erstes Ergebnis mit Deinem Link (Auszug):

hart und steif wurde wie eine güne Buxmeßnuna stzeiäe sich ihren Reck uber denK\^pfund machte ein paar Schritte mfdep goßen Kirsäenk zu.Sie eüiete beideTüren und ein Stunnelstrium um Kettenßumnimasken und ckrchsichtiger Spitzen·wäsche

Ich übe noch, vielen Dank jedenfalls mal.

krilliam Bolderson · 11.08.2009

Das wäre doch was für Mundart

Schrei Bär · 11.08.2009

also n hunni ist mir mein finereader echt wert. der erkennt alles, so lange die auflösung stimmt. der schneidet und dreht auch automatisch gerade, liest zeitung und von farbigem papier, bildet tabellen bearbeitbar nach und nutzt mehrfacheinzug. mit freeware kriegt man mehr salat. scanne mit gut 200 dpi, dann wird ocr generell besser.

Makita · 11.08.2009

krill, Du willst wohl ein Stunnelstrium in die Buxmeßnuna! Kannst Du denn gar nichts ernstnehmen? Ich leide hier, Du ahnst es nicht.
Jetzt versuche ich gerade, ein language pack zu installieren. Das eröffnet ganz neue Möglichkeiten für bizarrste Fehlermeldungen.

Da, guckt, was es gebracht hat:

z! ,_¤¤: ¢ x .
¤ ~!®;*¢· Ö? *1 Ei; ¤··w*= —« ..
‘ ,4, ' T-„E£ »"‘§ ‘ é . &;-‘- V ’ !¥. ‘ g "" ‘?° ¤ 2;;* gw ,„„ , ,_
if ' — ’'“ ‘ Hä ·— ‘ ‘ E ‘“ ‘ E pf " ÄQ._ $== —·— · ~: ~-V»— · A „ ,

SchreiBär, daß Dein Programm taugt, bezweifle ich nicht. Mit der Demo hatte ich viel Freude, bevor sie nach wenigen Scans grausam ablief.
Ich hab aber keinen Hunni. Geduld hab ich auch nicht, aber vor allem keinen Hunni.

Schrei Bär · 11.08.2009

wieviele seiten sinds denn? evtl. mach ich das.

Makita · 11.08.2009

Danke, SchreiBär, für das liebe Angebot, aber es sind zu viele Seiten, über hundert, auf teilweise schauerlichst zerknicktem Karopapier, vergilbt, uralte Schreibmaschine oder totenblasser Nadeldrucker, teilweise winzigkleine Buchstaben; es ist handschriftlich darin herumgekritzelt, manches ist nach den Regeln des Mad Professor mithilfe rostiger Büroklammern irgendwie gebündelt, das meiste fliegt einfach so herum.
Ich hab mir in den Kopf gesetzt, das einzuscannen und zu korrigieren, weil geile Sachen dabei sind, geschrieben von einem alten Freund, den ich jahrelang nicht gesehen habe und der mir das jetzt endlich in die Finger gab ("Mach damit, was du willst"). Vielleicht kann ich ihn in ferner Zukunft sogar noch dazu überreden, sich ein Internet zuzulegen.

Inzwischen konnte ich einen Teilerfolg verbuchen: FreeOCR hat mein language pack gefressen, und mit Deinem Tip zur niedrigen Auflösung hab ich 6 der unproblematischeren Seiten brauchbar eingescannt.

Dellen · 11.08.2009

Das aktuelle Word hat siw OCR integriert*.
Lies mal diesen Artikel; in den Kommentaren werden auch noch andere Programme erwähnt: http://lifehacker.com/342828/scan-images-to-text-in-microsoft-word
Oder laß es Google machen: http://www.labnol.org/software/convert-scanned-pdf-images-to-text-with-google-ocr/5158/

*Ist natürlich nicht kostenlos, aber die Office Home&Student-Lizenz ist die 75,- schon wert, finde ich.

yours truly · 11.08.2009

Word kostet aber Geld.

Und Google machts mit Tesseract, das auch FreeOCR verwendet und das Ding hinter dem Link von Berg.

Berg · 11.08.2009

Noch ein Kandidat:
http://www.topocr.com/topocr.exe

Wenn man die richtige Sprache einstellt, soll es ganz gut gehen. Viel Glück!

Dellen · 12.08.2009

yours truly schrieb:
Word kostet aber Geld.

Ja. Der dummerweise nicht hingeschriebene Gedanke hinter meinem Post oben war, daß Word auf vielen Rechnern sowieso installiert ist, aber vermutlich nur wenige Leute von den OCR-Fähigkeiten wissen.

jobär · 12.08.2009

Hallo Makita,

ich scane sehr viel mit einem alten Finereader 5.0, den ich mal für n paar Euro bei Amazon erworben habe. Das zentrale Problem sehe ich bei

zerknicktem Karopapier, vergilbt, uralte Schreibmaschine ... totenblasser Nadeldrucker, ... winzigkleine Buchstaben; ... handschriftlich darin herumgekritzelt

Das ist nach meinen Erfahrungen oft nur mit viel Arbeit - hohe Auflösung und mit Helligkeit und Kontrast herumprobieren - zu schaffen und auch dann ist sehr viel Korrekturarbeit erforderlich.
Ich scanne in diesen Fällen die Texte erst einmal mit einem Zeichenprogramm (notfalls Paint) ein und speichere sie. Dann Bearbeitung der Texte (Flecken und handschriftliche Notizen soweit möglich entfernen) und dann im OCR durchlaufen lassen, wenn ich mal wieder Zeit habe.
Auf jeden Fall eine zeitraubende Arbeit, die mich in manchen Fällen dazu getrieben hat, die Texte abzutippen, weils einfach schneller geht und nicht so frustrierend ist.

Gruss

Jobär

Suche

Anständige Freeware zur Texterkennung

Makita

Berg

Makita

krilliam Bolderson

Schrei Bär

Mitglied

Makita

Schrei Bär

Mitglied

Makita

Dellen

Mitglied

yours truly

Berg

Dellen

Mitglied

jobär

Letzte Empfehlungen

Neue Texte

Cookie-Hinweis