docx2txt - это написанная на perl утилита командной строки, позволяющая конвертировать документы формата Microsoft Office(Tm) Docx в простой текстовый (ASCII) формат, сохраняя некоторые элементы форматирования и информацию о документе.
docx2txt - это платформонезависимое решение, сосотящее из основного ядра на Perl и шелл-скрипта для Unix/Windows, предоставляющего графический интерфейс к программе. В конфигурационном файле задаются параметры выходного текста.
Утилита может быть использована для построения веб-сервисов с преобразованием docx-файлов в текст.
Используя в паре с docx2txt разархиваторы типа CakeCmd, которые могут работать с поврежденными Zip-архивами, можно извлекать текст из поврежденных docx-файлов во многих случаях, где MS word не справляется.
Лицензия - GPLv3.
Тип приложения: консольная программа
Сайт разработчика:
Разместил: