Subject: полуОФФ: какой у Вас PDF Transformer? gen. Доброе утро!Посоветуйте, пожалуйста, как можно перегнать файл PDF в формат, пригодный для перевода. Исходный файл PDF содержит много картинок, табличек и прочих элементов, и обычный PDF Transformer на выходе в ворде выдает хаос. Спасибо! |
ABBYY FineReader |
ABBYY FineReader +1 (Professional вроде) |
Rami88 +1. Еще иногда помогает Adobe Acrobat Pro. |
Даже пользуясь программой PDF Transformer можно получить хороший результат, если вручную перед распознаванием выделить текст, таблицы и изображения соответствующим инструментом. Помогает и распознавание файла по одной странице за раз. |
перед распознаванием нужно вручную сделать отрисовку таблиц, обозначить области текста и картинок без этого любая распознавалка выдаст хлам |
подписываюсь, автоматическое распознавание sucks, надо обязательно выделять области вручную. |
о, а расскажите, пожалста, как и зачем выделять области вручную? в pdf-файле? а то я такого не делаю. |
в файнридере. он может автоматически распознать, но получается, как правило, кал. а если выделять в документе области (текст, картинка, таблица и т.д.), то весьма сносно получается. |
на МТ предложили как-то http://docs.zone/pdf-to-word я несколько раз пользовалась - он все форматы сохранил |
ну, допустим, в таблице скрыта сетка и программа будет распознавать ее сплошным текстом, т.е. вся таблица съедет, или распознает таблицу в несколько колонок текста. А если эту таблицу предварительно разлиновать и показать, что там строки и столбцы, тогда программа распознает ее правильно |
да-да, бывший пдф-бургер, naiva предложила:) хороший вариант, особенно для "true pdf". |
эээ.. что-то я не поняла, где линовать? открываю файнридер: новая задача - > распознать пдф в ворд -> оформление документа: простой текст А дальше все, выбора нет, он распознает и все. |
Petrelnik, ты не в меню "файл-щмайл" и т.д. смотри, а в инонках. там есть иконки "текст" (буква Т), картинка, таблица... |
http://saveimg.ru/show-image.php?id=7b8235ad67720fa13fc2445faa0590e8 там, оказывается, не только иконки, но и подписано, что и где. |
ааа) спасибо, попробую. |
Спасибо за ценную информацию! |
@ааа) @спасибо, попробую. рекомендую сразу нажать волшебную кнопку и внести нужные настройки, чтоб не париться с повторными сегментациями/распознаваниями |
Эти волшебные настройки навсегда НЕ освобождают от необходимости вручную указывать программе каждый раз, что и как она должна распознавать (текст, изображение, таблицу). |
зато они навсегда освобождают от автоматического распознавания косячной автосегментации или позволяют вовсе не тратить время на ее выполнение |
Простите, а что такое "автосегментация"? И какое отношение эта ..ция имеет к распознаванию текста, таблиц и графики? |
автосегментация - это выделение блоков текста, таблиц и графики файнридером в автоматическом режиме (в моей версии FR это называется анализ документа/страницы) |
Тогда, получается, надо Вам перечитать первый пост ветки, который про то, как бороться с этим автовыделением и результатами его работы. |
уточняю - про то "Как бороться?" |
>>Тогда, получается, надо Вам перечитать первый пост ветки, который про то, как бороться с этим автовыделением и результатами его работы. перечитал. |
Однако на рисунке показано про "включить" |
рисунок приведен только для указания места расположения волшебной кнопки и вида вызываемого окна (которое я лично нашел только на втором году пользования FR :) ) |
glomurka, спасибо огромное! Уважаемые переводчики, простите за офф, но не в курсе ли вы, бывают ли на распознавалки "совместные закупки" или "акции" какие-нибудь (наподобие тех, что случаются для "кошек" на ПроЗе). |
Самая лучшая программа - First PDF. http://www.pdftoword.ru/download.html Для нее нет ничего невозможного. |
@бывают ли на распознавалки "совместные закупки" или "акции" какие-нибудь где-нибудь на что-нибудь какие-нибудь "акции" бывают всегда!! |
Coca Cola, ЛС |
|
link 19.05.2015 10:42 |
Можно распознать "традиционным" способом страницы с преобладанием текста, а для картинок и сложных таблиц использовать программку PDF Editor, например, или подобные, которые позволяют делать "заплатки" поверх надписей в файле пдф. |
|
link 19.05.2015 11:10 |
Или вырезать неудобные для распознания куски, переводить их в графическом редакторе Paint и вставлять в перевод в виде картинок. А остальное просто переводить "с листа". ИМХО так будет и проще и красивее :-)) |
glomurka, спасибо! Но я под категории не подпадаю )). Но можно, наверно, знакомых преподавателей попросить приобрести лицензионное ПО. 40% скидка - это существенно. По поводу онлайн-конвертера: здесь то же самое, что и с "облаком" в плане "защиты информации" (т.е. никак не гарантирована)? |
Jannywolf, я обычно по таким вопросам не парюсь ваще:) но если там суперсекретная инфа, то можно и поволноваться: разумеется, всё, что аплоудится в онлайн, может вполне сохраниться у них на серверах. |
Понятно, спасибо. |
You need to be logged in to post in the forum |