среда, 13 июня 2007 г.

Из PDF в DOC

Я уже рассматривал сервис, который помимо прочего позволяет конвертировать файлы PDF в файлы DOC (Microsoft Word). Делал он это неплохо, но вот что я впоследствие обнаружил: каждая строка представляет собой после конвертации отдельный абзац! Запросы у меня, конечно, не слишком большие, 100-страничные документы мне не надо преобразовывать, и в принципе могу я позволить себе вручную слить строки в абзацы. "Но осадок-то остался!".
Короче, нашел я еще одну программку, которая только тем и занимается, что PDF в DOC конвертирует. Название у нее незатейливое - PDF2Word, произведение фирмы VeryPDF. И это первая небесплатная программа, которую я буду рассматривать в своей Тестовой Лаборатории им. Флегматика.
VeryPDF PDF2WordЯ проверял работу программы на тех же файлах, что и Zamzar, так что результаты оценить уже более-менее мог. Выходные файлы получились по крайней мере не хуже. Формулы, конечно, поплыли и стали по большей части нечитаемыми - тут Zamzar оказался впереди. Зато сам текст распознался лучше: сохранилось разбиение по абзацам (то есть по строкам документ не разбит) и даже распознались некоторые (почему-то только некоторые) нумерованные списки. С картинками как у Zamzar, так и PDF2Word никаких проблем не возникло.
В общем, я бы отдал победу PDF2Word, если бы не разница в цене.
Производитель заявляет поддержку PDF 1.6 (что соответствует Adobe Acrobat 7.0) и кучи языков, среди которых даже китайский и русский. Файлы можно конвертировать в пакетном режиме. Удобная фича - поддержка drag'n'drop; достаточно просто перетащить PDF-файл в окно программы для конвертации.
PDF2Word поставляется как shareware и позволяет осуществить 100 почти полнофункциональных запусков (конвертация не более 5 файлов одновременно) перед вводом ключа. Одна лицензия стоит $39.95. Скачать программу можно с сайта производителя.
Учитывая те самые 100 запусков, что очень немало, пока буду пользоваться.

3 коммент.:

Анонимный комментирует...

У меня не работает, как были квадратики и прочие символы, так и остались.

Flegmatic комментирует...

Не уверен, что понял. Если у вас были квадратики, то они, безусловно, квадратиками и останутся. Если же квадратиками стал нормальный текст, то расскажите подробнее.

Геннадий комментирует...

Советую прочитать эту статью: http://seucomp.ru/iz_pdf_v_doc.php про конвертацию pdf