DictionaryForumContacts

 Val61

1 2 all

link 25.08.2014 12:38 
Subject: Верстка PDF в Word и обратно. Нужен совет по исполнителю. gen.

 Ma_linka

link 5.03.2015 13:00 
Распознала 10 страниц на сайте Abby, по ошибке выбрала "распознать в пдф файл", а не вордовский. Но фишка в том, что после распознавания моей пдф-ки а Абби, кириллица нормально копируется в Ворд, не загогулинами и крючками. Почему так?

 Aiduza

link 5.03.2015 14:00 
abbyY!

 azu

link 5.03.2015 14:07 
AsIs
Хуже, когда эти уставы еще и сканировать для этого самому надо - а они сшиты намертво. Чаще все-таки ищу похожий и глазами вычитываю.

 Val61

link 5.03.2015 14:38 
alk 5.03.2015 12:19
Редактирование pdf это все-таки ересь, как бы не совершенствовались механизмы этой ереси.

Ересь. Конечно. Никто и не спорит. Хуже того, буквально сегодня утром... Сначала предыстория. Присылают в перевод брошюрку. В ПДФ. Загоняю ее в Инфикс, правлю немного текст-боксы, экспортирую в xml, загоняю его в САТ... В общем, все как обычно, процесс налажен. Засада кроется в том, что брошюрка исполнена т.н. "коммерческим" шрифтом TradeGothic, в котором отсутствуют символы кириллицы. Что делать? Да ничего. Заменить его на Arial Narrow, еще чутку подправить и все. Сделано, отправлено. В ПДФ, само собой. Я ведь не извлекал текст в Ворд. С дискляймером про замену шрифта и предложением менять шрифт самим, если оно им нужно.
Проходит месяц-полтора, от заказчика прилетает просьба прислать
тот же файл, но в Ворде. Я немного подивился, т.к. это они мне должны Ворд присылать, а не я им делать Ворд из ПДФ. Ну, Акробат у меня есть, сэйв эз Ворд и вперед. Чутку форматирование слетело, но не сильно, все читается. Опять оттуда: присланный вами файл Ворд не соответствует исходному формату (слетели цвета).
Были посланы в грубой форме (что у нас в конторе категорически недопустимо, но они реально вывели меня из себя). "Они" - это наш отдел маркетинга и рекламы в Хьюстоне. Предложил им сначала прислать мне текст для перевода, а потом самим корячиться с версткой как хотят. Теперь жду продолжения банкета. Вконец добило то, что тут же прислали несколько новых брошюрок (в ПДФ) и перевод в Ворде, исполненный каким-то местным иммигрантом, с просьбой проверить. Перевод у этого человека вышел ужОс-ужОс, о чем я им и написал. Сюр какой-то, короче.

 glomurka

link 5.03.2015 15:36 
>>Распознала 10 страниц на сайте Abby, по ошибке выбрала "распознать в пдф файл", а не вордовский. Но фишка в том, что после распознавания моей пдф-ки а Абби, кириллица нормально копируется в Ворд, не загогулинами и крючками. Почему так?

Может потому, что не все OCR могут в кириллицу? Я пару раз видел понимающие только латиницу да цифры.

 alk moderator

link 5.03.2015 16:28 
конечно, в FineReader все получится нормально, это еще нужно постараться все сделать неправильно. Очень трудно гадать, скорее всего что-то неверно в первоначальном документе, шрифт в документе и т.п. Если у Вас есть возможность работать с оригиналом, из которого получается неправильный pdf, попробуйте проверить, что там за шрифт, заменить его на обычный из стандартного набора Windows. В общем, там можно долго пробовать - если документ в Word, можно его в pdf средствами Word превратить.
В самом pdf можно в свойствах посмотреть, какие шрифты там используются.

 AsIs

link 5.03.2015 20:31 
Ma_linka, смотрите личное сообщение. Две позиции из трех любезно предоставлены мне Валерием Михалычем. Если потеряете ЛС, напишите еще раз – подниму ветку.

 Val61

link 6.03.2015 5:34 
AsIs 5.03.2015 9:22
Вот это было бы полезно. Я не умею (ПДФ-ФР-ПДФ). Будем ждать.

Стал рыться в своих документах на предмет выбрать какой-нибудь показательный для разбора и демонстрации, к сожалению, оказывается, что у меня все сплошь родное-фирменное-конфиденциальное, на ютюб выкладывать никак нельзя. Так что если презентацию устраивать для публики, то присылайте мне ваши проблемные пэдээфки в почту: val61.webinar@yandex.ru, я покажу как с ними правильно бороться. Это не только AsIs касается, а всех.

 Val61

link 8.03.2015 23:27 
Сваял ролик для страждущих.
http://www.youtube.com/watch?v=XeFEK3V2znk

 alk moderator

link 9.03.2015 9:21 
познавательно, спасибо
Конечно, самая интересная часть - это взаимодействие с программой памяти переводов, которая действительно ускоряет процесс. Все остальное сводится только к тому, чтобы загрузить в нее распознанный текст, а потом отправить результат обратно. Безусловно, интересно работает подстановка результата перевода в виде xml-файла обратно в редактор pdf Infix.
Однако в целом все получается весьма затратно и перенасыщено операциями.
Мне показалось, что проще было бы на выходе FR, или Transformer+, который дешевле, получить файл Word, этот файл отправить в память переводов, а потом получить на выходе переведенный файл Word, там все редактировать до опупения, а потом уж, если действительно кому-то позарез нужно, чтобы это был pdf, сделать в Word'е pdf.
В реальности же и это все излишне. Ведь верстать брошюру переводчику не с руки, пусть это делает заказчик. Извлекли FR'ом текст, перевели его в TM, передали переведенный текст заказчику. В крайнем случае, пометили карандашиком сегменты, куда какой русский текст вместо английского вставлять, чтобы верстальщик не перепутал. Всё. Никаких потерь времени на переверстку

 Val61

link 9.03.2015 11:09 
Все зависит от ТЗ. Ну и от оплаты, разумеется.
Если вам ставят задачу не только перевести, но и воспроизвести исходный формат и платят именно за такой результат, то вы или будете корячиться, или не будете работать с таким заказчиком вовсе. Это ваш выбор и диктуется он именно размером оплаты труда. Для примера скажем, что такая страничка, как в ролике, обходится заказчику примерно в 1200 рублей.
Если ПДФ по структуре простой, редактируется полностью и легко, то проще всего его сохранить в Ворд прямо из Акробата. Но можно и из любого ПДФ-трансформера.
Если ПДФ, как показано в ролике, представляет из себя по сути отсканированное изображение, то тут возможны варианты. Да, часто можно тупо на автомате прогнать через любой трансформер прямо в Ворд. Но иногда - нельзя. И тогда приходится делать то, что я показал.
Если у коллег есть свои особые приемчики для работы в такой среде, м.б. тоже поделятся?

 AsIs

link 10.03.2015 10:42 
9.03.2015 2:27
Спасибо!

 

You need to be logged in to post in the forum

Get short URL | Pages 1 2 all