DictionaryForumContacts

 Coca Cola

link 18.05.2015 9:29 
Subject: полуОФФ: какой у Вас PDF Transformer? gen.
Доброе утро!
Посоветуйте, пожалуйста, как можно перегнать файл PDF в формат, пригодный для перевода.
Исходный файл PDF содержит много картинок, табличек и прочих элементов, и обычный PDF Transformer на выходе в ворде выдает хаос.
Спасибо!

 Rami88

link 18.05.2015 9:40 
ABBYY FineReader

 Petrelnik

link 18.05.2015 9:44 
ABBYY FineReader +1
(Professional вроде)

 Greso

link 18.05.2015 9:46 
Rami88 +1. Еще иногда помогает Adobe Acrobat Pro.

 tumanov1

link 18.05.2015 9:47 
Даже пользуясь программой PDF Transformer можно получить хороший результат, если вручную перед распознаванием выделить текст, таблицы и изображения соответствующим инструментом. Помогает и распознавание файла по одной странице за раз.

 akhmed

link 18.05.2015 9:49 
перед распознаванием нужно вручную сделать отрисовку таблиц, обозначить области текста и картинок
без этого любая распознавалка выдаст хлам

 Rami88

link 18.05.2015 9:53 
подписываюсь, автоматическое распознавание sucks, надо обязательно выделять области вручную.

 Petrelnik

link 18.05.2015 9:55 
о, а расскажите, пожалста, как и зачем выделять области вручную? в pdf-файле?
а то я такого не делаю.

 Rami88

link 18.05.2015 10:03 
в файнридере. он может автоматически распознать, но получается, как правило, кал. а если выделять в документе области (текст, картинка, таблица и т.д.), то весьма сносно получается.

 Erdferkel

link 18.05.2015 10:05 
на МТ предложили как-то
http://docs.zone/pdf-to-word
я несколько раз пользовалась - он все форматы сохранил

 akhmed

link 18.05.2015 10:08 
ну, допустим, в таблице скрыта сетка и программа будет распознавать ее сплошным текстом, т.е. вся таблица съедет, или распознает таблицу в несколько колонок текста. А если эту таблицу предварительно разлиновать и показать, что там строки и столбцы, тогда программа распознает ее правильно

 Rami88

link 18.05.2015 10:08 
да-да, бывший пдф-бургер, naiva предложила:) хороший вариант, особенно для "true pdf".

 Petrelnik

link 18.05.2015 10:14 
эээ.. что-то я не поняла, где линовать?
открываю файнридер:
новая задача - > распознать пдф в ворд -> оформление документа: простой текст
А дальше все, выбора нет, он распознает и все.

 Rami88

link 18.05.2015 10:26 
Petrelnik, ты не в меню "файл-щмайл" и т.д. смотри, а в инонках. там есть иконки "текст" (буква Т), картинка, таблица...

 Rami88

link 18.05.2015 10:30 
http://saveimg.ru/show-image.php?id=7b8235ad67720fa13fc2445faa0590e8
там, оказывается, не только иконки, но и подписано, что и где.

 Petrelnik

link 18.05.2015 10:35 
ааа)
спасибо, попробую.

 Coca Cola

link 18.05.2015 11:20 
Спасибо за ценную информацию!

 glomurka

link 18.05.2015 11:27 
@ааа)
@спасибо, попробую.

рекомендую сразу нажать волшебную кнопку и внести нужные настройки, чтоб не париться с повторными сегментациями/распознаваниями

 tumanov1

link 18.05.2015 11:31 
Эти волшебные настройки навсегда НЕ освобождают от необходимости вручную указывать программе каждый раз, что и как она должна распознавать (текст, изображение, таблицу).

 glomurka

link 18.05.2015 11:37 
зато они навсегда освобождают от автоматического распознавания косячной автосегментации или позволяют вовсе не тратить время на ее выполнение

 tumanov1

link 18.05.2015 11:40 
Простите, а что такое "автосегментация"?
И какое отношение эта ..ция имеет к распознаванию текста, таблиц и графики?

 glomurka

link 18.05.2015 11:45 
автосегментация - это выделение блоков текста, таблиц и графики файнридером в автоматическом режиме (в моей версии FR это называется анализ документа/страницы)

 tumanov1

link 18.05.2015 11:52 
Тогда, получается, надо Вам перечитать первый пост ветки, который про то, как бороться с этим автовыделением и результатами его работы.

 tumanov1

link 18.05.2015 11:54 
уточняю - про то "Как бороться?"

 glomurka

link 18.05.2015 11:58 
>>Тогда, получается, надо Вам перечитать первый пост ветки, который про то, как бороться с этим автовыделением и результатами его работы.

перечитал.
Спрашивают: Как бороться?
Отвечаю: Отключить.
по-моему, нормально :)

 tumanov1

link 18.05.2015 12:05 
Однако на рисунке показано про "включить"

 glomurka

link 18.05.2015 12:15 
рисунок приведен только для указания места расположения волшебной кнопки и вида вызываемого окна (которое я лично нашел только на втором году пользования FR :) )

 Jannywolf

link 18.05.2015 12:24 
glomurka, спасибо огромное! Уважаемые переводчики, простите за офф, но не в курсе ли вы, бывают ли на распознавалки "совместные закупки" или "акции" какие-нибудь (наподобие тех, что случаются для "кошек" на ПроЗе).

 Bultimdin

link 18.05.2015 13:05 
Самая лучшая программа - First PDF.

http://www.pdftoword.ru/download.html

Для нее нет ничего невозможного.
:)

 glomurka

link 18.05.2015 13:26 
@бывают ли на распознавалки "совместные закупки" или "акции" какие-нибудь

где-нибудь на что-нибудь какие-нибудь "акции" бывают всегда!!
:)
http://www.abbyy.ru/promo/edu/?from=shop_special_offers

 AsIs

link 18.05.2015 13:43 
Coca Cola, ЛС

 intertrans

link 19.05.2015 10:42 

 i_sokol

link 19.05.2015 10:57 
Можно распознать "традиционным" способом страницы с преобладанием текста, а для картинок и сложных таблиц использовать программку PDF Editor, например, или подобные, которые позволяют делать "заплатки" поверх надписей в файле пдф.

 wise crocodile

link 19.05.2015 11:10 
Или вырезать неудобные для распознания куски, переводить их в графическом редакторе Paint и вставлять в перевод в виде картинок. А остальное просто переводить "с листа". ИМХО так будет и проще и красивее :-))

 Jannywolf

link 19.05.2015 12:10 
glomurka, спасибо! Но я под категории не подпадаю )). Но можно, наверно, знакомых преподавателей попросить приобрести лицензионное ПО. 40% скидка - это существенно.

По поводу онлайн-конвертера: здесь то же самое, что и с "облаком" в плане "защиты информации" (т.е. никак не гарантирована)?
В смысле, если заказчик присылает работу по мэйлу, то, в принципе, я ничем не рискую, прогоняя такой (присланный по мэйлу) пдф через "pdf-to-word"?
Как-то боязно...
Простите за глупые вопросы.

 Rami88

link 19.05.2015 12:26 
Jannywolf, я обычно по таким вопросам не парюсь ваще:) но если там суперсекретная инфа, то можно и поволноваться: разумеется, всё, что аплоудится в онлайн, может вполне сохраниться у них на серверах.

 Jannywolf

link 19.05.2015 12:52 
Понятно, спасибо.

 

You need to be logged in to post in the forum