Утилита занимается распознанием текста непосредственно из djvu-файла.
ocrodjvu может как дописывать текстовый слой в обрабатываемый документ, так и создавать новый, является фронт-ендом для различных OCR-движков (по умолчанию используется оболочка для Tesseract под названием OCRopus).
Движки к сожалению, поддерживают не так уж много языков, pусский распознаётся только с помощью Cuneiform.
Автор: Jakub Wilk, лицензия: GPL
Тип приложения: консольная программа
Сайт разработчика:
Что почитать?
Разместил: