Print this Page. Send this Page.

OCRopus OCR System

Dec 01, 2010 02:30 pm to 04:30 pm

Auf Einladung von Projekt D16 am Cluster (Reasoning in South Asian and Tibetan Buddhism) wird Prof. Thomas Breuel (Univ. Kaiserslautern) am 1.12. einen Vortrag über OCRopus halten, ein Texterkennungsprogramm mit offenem Quellcode, das auch für indische Schriften einsetzbar ist. Sie sind hiemit alle herzlich eingeladen!

Für Interessierte sei noch auf folgendes Paper von Thomas Breuel über OCRopus und Sanskrit hingewiesen:
"Applying the OCRopus OCR System to Scholarly Sanskrit Literature", Sanskrit Computational Linguistics, Lecture Notes in Computer Science, 2009, Volume 5402/2009, 391-402.
PDF: http://www.springerlink.com/content/q7518539607v5180/

 

Das OCRopus OCR System

Prof. Dr. Thomas Breuel
Universität Kaiserslautern

 

OCRopus ist ein OCR System zur Digitalisierung von Büchern für digitale Bibliotheken, das seit einigen Jahren in unserer AG in Entwicklung ist.  Es wird gegenwärtig zur Umwandlung von Büchern in lateinischer Schrift eingesetzt.  Das System erlaubt es, einfach verschiedene Dokumentanalysemodule miteinander zu verbinden und verwendet moderne Mustererkennungs- und Sprachmodellierungsmethoden. Ich beschreibe  die Struktur und Arbeitsweise des OCRopus Systems.  Dann gehe ich auf die Entwicklungen ein, die wir gegenwärtig zur Unterstützung nicht-lateinischer Schriften durchführen, einschließlich der Trainingstools und der Generalisierung auf Unicode.  Ich werde insbesondere auf die speziellen Anforderungen von indischen Schriften eingehen.

  

Back
Search