Приложение для оптического распознавания текстов (OCR).
Tesseract разрабатывалась компанией Hewlett-Packard с середины 1980-х по середину 1990-х, а затем 10 лет «пролежала на полке». В августе 2006 г. Google купил её и открыл исходные тексты под лицензией Apache 2.0 для продолжения разработки.
В настоящий момент приложение уже работает с UTF-8, поддержка языков (включая русский с версии 3.0) осуществляется с помощью дополнительных модулей.
Тип приложения: консольная программа
Сайт разработчика:
Что почитать?
Разместил: