OCRFeeder

0
Ваша оценка: Нет

Удобный Python / GTK+ графический интерфейс к нескольким консольным OCR (optical character recognition) приложениям.

OCRFeeder автоматически определяет наличие инсталлированных в системе OCR приложений, а именно Cuneiform, GOCR, Ocrad, Tesseract, используя их в качестве "движка", а для распознания структуры документа применяется собственный алгоритм. При использовании системы анализа структуры изображения автоматически определяется графическое и текстовое содержимое. Производится оптическое распознавание текста документа, сохраняя его в файл формат которого позволяет редактировать текстовое содержимое.

В OCRFeeder можно импортировать данные как из графических файлов, множества популярных форматов (JPEG, PNG, BMP, TIFF, GIF, PNM, PPM, PBM и прочих...), из файла PDF, а так же поддерживается захват изображения непосредственно от устройства сканирования. Изображения так же могут быть добавлены простым перетаскиванием из файлового менеджера, на окно приложения (функция drag-and-drop) или из контекстного меню (интеграция с Nautilus).

OCRFeeder позволяет очистить исходное изображение (без коррекции оригинала), в открытом изображении задать или изменить границы зон распознавания, выбрать наиболее подходящий для конкретного документа "движок" распознавания символов, имеется возможность коррекции не распознанных символов, настроить стили параграфов, применить проверку орфографии в распознанном тексте с помощью aspell (libaspell) и выбрать шрифт для сохраняемых документов. Основным форматом для сохранения результатов распознавания в OCRFeeder является ODT (OpenDocument Format). Но так же текст может быть сохранён в обычном текстовом формате TXT, или в HTML.

Хотя OCRFeeder и разрабатывается как приложение с графическим интерфейсом (GUI), но имеется возможность работы и из командной строки (ocrfeeder-cli). Это может оказаться полезным для автоматической пакетной обработки документов (используя "движок" определённый в настройках основным).

Лицензия: GNU GPL v3

Тип приложения: другие программы для графического режима
Сайт разработчика: http://live.gnome.org/OCRFeeder
Что почитать?


Разместил: lsadm2013kos 24 Август 2011 в 19:37