Cuneiform

0
Ваша оценка: Нет

Приложение для оптического распознавания текста документов российской компании Cognitive Technologies. Результаты работы CuneiForm можно редактировать в офисных программах и текстовых редакторах и сохранять в популярных форматах, проводить по ним полнотекстовый поиск.

Возможности * При распознавании с помощью CuneiForm сохраняется структура документа и его форматирование. * Программа распознает таблицы любой структуры и сложности, в том числе и без отображения линий табличной сетки. * Распознаются любые печатные шрифты: книги, газеты, журналы, распечатки с лазерных и матричных принтеров, тексты с пишущих машинок и т.п. * Алгоритмы оптического распознавания (OCR, Optical Character Recognition), встроенные в программу позволяют распознавать текст с матричного принтера, плохих ксерокопий и факсов. * Распознавание документов более чем на 20 языках: на русском, английском, немецком, французском, испанском, итальянском, шведском, украинском и других. * Для повышения качества распознавания в программе используется словарная проверка. При этом стандартный словарь расширить за счет импорта новых слов из текстовых файлов.

Тип приложения: консольная программа
Сайт разработчика: https://launchpad.net/cuneiform-linux
Что почитать?


Разместил: vikos 2 Январь 2011 в 16:27