Subject: Верстка PDF в Word и обратно. Нужен совет по исполнителю. gen.
|
Распознала 10 страниц на сайте Abby, по ошибке выбрала "распознать в пдф файл", а не вордовский. Но фишка в том, что после распознавания моей пдф-ки а Абби, кириллица нормально копируется в Ворд, не загогулинами и крючками. Почему так? |
abbyY! |
AsIs Хуже, когда эти уставы еще и сканировать для этого самому надо - а они сшиты намертво. Чаще все-таки ищу похожий и глазами вычитываю. |
alk 5.03.2015 12:19 Редактирование pdf это все-таки ересь, как бы не совершенствовались механизмы этой ереси. Ересь. Конечно. Никто и не спорит. Хуже того, буквально сегодня утром... Сначала предыстория. Присылают в перевод брошюрку. В ПДФ. Загоняю ее в Инфикс, правлю немного текст-боксы, экспортирую в xml, загоняю его в САТ... В общем, все как обычно, процесс налажен. Засада кроется в том, что брошюрка исполнена т.н. "коммерческим" шрифтом TradeGothic, в котором отсутствуют символы кириллицы. Что делать? Да ничего. Заменить его на Arial Narrow, еще чутку подправить и все. Сделано, отправлено. В ПДФ, само собой. Я ведь не извлекал текст в Ворд. С дискляймером про замену шрифта и предложением менять шрифт самим, если оно им нужно. |
>>Распознала 10 страниц на сайте Abby, по ошибке выбрала "распознать в пдф файл", а не вордовский. Но фишка в том, что после распознавания моей пдф-ки а Абби, кириллица нормально копируется в Ворд, не загогулинами и крючками. Почему так? Может потому, что не все OCR могут в кириллицу? Я пару раз видел понимающие только латиницу да цифры. |
конечно, в FineReader все получится нормально, это еще нужно постараться все сделать неправильно. Очень трудно гадать, скорее всего что-то неверно в первоначальном документе, шрифт в документе и т.п. Если у Вас есть возможность работать с оригиналом, из которого получается неправильный pdf, попробуйте проверить, что там за шрифт, заменить его на обычный из стандартного набора Windows. В общем, там можно долго пробовать - если документ в Word, можно его в pdf средствами Word превратить. В самом pdf можно в свойствах посмотреть, какие шрифты там используются. |
Ma_linka, смотрите личное сообщение. Две позиции из трех любезно предоставлены мне Валерием Михалычем. Если потеряете ЛС, напишите еще раз – подниму ветку. |
AsIs 5.03.2015 9:22 Вот это было бы полезно. Я не умею (ПДФ-ФР-ПДФ). Будем ждать. Стал рыться в своих документах на предмет выбрать какой-нибудь показательный для разбора и демонстрации, к сожалению, оказывается, что у меня все сплошь родное-фирменное-конфиденциальное, на ютюб выкладывать никак нельзя. Так что если презентацию устраивать для публики, то присылайте мне ваши проблемные пэдээфки в почту: val61.webinar@yandex.ru, я покажу как с ними правильно бороться. Это не только AsIs касается, а всех. |
познавательно, спасибо Конечно, самая интересная часть - это взаимодействие с программой памяти переводов, которая действительно ускоряет процесс. Все остальное сводится только к тому, чтобы загрузить в нее распознанный текст, а потом отправить результат обратно. Безусловно, интересно работает подстановка результата перевода в виде xml-файла обратно в редактор pdf Infix. Однако в целом все получается весьма затратно и перенасыщено операциями. Мне показалось, что проще было бы на выходе FR, или Transformer+, который дешевле, получить файл Word, этот файл отправить в память переводов, а потом получить на выходе переведенный файл Word, там все редактировать до опупения, а потом уж, если действительно кому-то позарез нужно, чтобы это был pdf, сделать в Word'е pdf. В реальности же и это все излишне. Ведь верстать брошюру переводчику не с руки, пусть это делает заказчик. Извлекли FR'ом текст, перевели его в TM, передали переведенный текст заказчику. В крайнем случае, пометили карандашиком сегменты, куда какой русский текст вместо английского вставлять, чтобы верстальщик не перепутал. Всё. Никаких потерь времени на переверстку |
Все зависит от ТЗ. Ну и от оплаты, разумеется. Если вам ставят задачу не только перевести, но и воспроизвести исходный формат и платят именно за такой результат, то вы или будете корячиться, или не будете работать с таким заказчиком вовсе. Это ваш выбор и диктуется он именно размером оплаты труда. Для примера скажем, что такая страничка, как в ролике, обходится заказчику примерно в 1200 рублей. Если ПДФ по структуре простой, редактируется полностью и легко, то проще всего его сохранить в Ворд прямо из Акробата. Но можно и из любого ПДФ-трансформера. Если ПДФ, как показано в ролике, представляет из себя по сути отсканированное изображение, то тут возможны варианты. Да, часто можно тупо на автомате прогнать через любой трансформер прямо в Ворд. Но иногда - нельзя. И тогда приходится делать то, что я показал. Если у коллег есть свои особые приемчики для работы в такой среде, м.б. тоже поделятся? |
You need to be logged in to post in the forum |