Cистема анализа документов и оптического распознавания символов (Optical Character Recognition — OCR) с консольным интерфейсом, для работы использующая Tesseract. Разработчик Thomas Breuel.
OCRopus(tm) имеет модульную систему распознавания, модульную систему анализа пакета символов в документе, статическое моделирование естественного языка и поддержку нескольких языков (поддерживаемых в Tesseract).
Исходный код доступен под лицензией Apache, проект спонсируется Google.
Тип приложения: консольная программа
Сайт разработчика:
Что почитать?
Разместил: