Subject: Верстка PDF в Word и обратно. Нужен совет по исполнителю. gen. Нужно разверстать из PDF в Ворд и потом сверстать обратно в PDF примерно 3000 (три тысячи) страниц. Исходные файлы в основном редактируемые, но прямое сохранение в Ворд Акробатом и/или попытка выгнать xml в Инфиксе приводят к необходимости объемистого доформатирования перевода вручную. Т.к. работы много, сам не справляюсь, начальство согласилось выделить денежку и привлечь стороннего верстальщика.Буду признателен за рекомендации и если кто-нибудь примерно сориентирует по расценкам. Можно в личку. Заранее спасибо. |
Добрый день! могу взяться за работу *есть специалист, да и сам не криворук ставки более чем разумные |
а вот этим не пробовали? http://pdfburger.com/pdf-to-word если PDF не графика, формат прекрасно сохраняется |
К сожалению, доформатирования требует не только графика, но и таблицы, хедеры, футеры и прочий мусор, которого в любом PDF полным полно. |
Это же к счастью! |
Дело не в инструментах. Инструменты имеются. Проблема с большим объемом работы и относительно ограниченными сроками. У меня есть еще и другая работа. Самое главное, удалось выяснить, что "в среднем по больнице, включая морг", ставка крутится вокруг 30 рублей за страницу первичной верстки и столько же - за верстку перевода. Некоторые, правда, просят 70 за "в одну сторону". В общем, пойду объяснять начальству, что конкретно означает "дадим денег". Когда дадут, буду думать, кому их отдать. Есть вариант, что зажмотятся и согласятся сдвинуть срок до Нового года. Тоже сгодится. |
за такие деньги они сами сверстают ... |
Я тоже могу взяться. Но за более разумные деньги, чем 30 руб/стр. ИП нет. |
за такие деньги они сами сверстают ... "Они сами" - это я и есть. Увы, ситуация такова, что доп. премию лично мне конкретно вот за это не выпишут. Максимум, что могу сделать, это кликнуть кличЪ у себя в офисе, вдруг найдутся энтузиасты подхалтурить "в свободное от исполнения основных служебных обязанностей время". За премию. Просто как вариант. И деньги отдать своим в виде премии проще, чем перечислять куда-то по договору, NDA подписывать и вообще гимор эйчарне и бухгалтерии устраивать. 2 ttimakina: Вот, в исходнике слова "Roller Bearing Seat Surface". Знаков с пробелами - 27. Переводится, стало быть, как "Поверхность посадочного места роликового подшипника". Знаков с пробелами - 51. Нужно вписать в то же пространство. Не больше и не меньше. Стало быть, подгонять размер шрифта и/или расстояние между символами. Вжик-вжик, одна минута. Или полторы. Но подобных заморочек по всему массиву - несколько сотен тысяч. При этом размеры шрифтов разные, размеры текст-боксов тоже. Вы все еще готовы взяться, да еще и за "более разумные деньги"? Это же не просто так, что тупо загнал в распознавалку, тупо вынул и готово. Тут туча ручного труда. Если бы все было просто, я и не парился бы. Акробат у меня есть... |
Геморр редкий, если конечно человек не одну собаку скушал на этом деле. На той неделе тоже пришлось текст выравнивать - проклял всё на свете ... |
Val61, я на таком не одну свору собак съела. Не сомневаюсь, что справлюсь. Такой работы не боюсь. Вопрос в разумных сроках и оплате. Ну и прежде, чем подписываться, конечно, посмотреть примеры самых "злобных" страничек. Или лучше для вашего/моего спокойствия пару-тройку страниц как тест сделать. Под более разумными имела в виду не 30 и даже не 70 руб/стр. )) |
Вот просто реально интересно себе на будущее: кто это в Москве делает такую работу за 30 или даже за 70 р/стр.? |
Syrira, ну а кто переводит за 90р/стр? "Они среди нас" :D |
За 90 р/стр. переводит гугл с минимальным участием человека-исполнителя и большим участием форума МТ. Соответственно и верстальщик будет такой же, надо полагать. |
Как правило, да, цена обратно пропорциональна качеству, но, знаете, не всегда. Может, не за 90, но за 150 встречались мне случаи, когда человек вполне толковый и переводит неплохо. Почему люди до такого "докатываются" и себя не ценят, другой вопрос, и не для этой ветки, посему умолкаю:) |
RE: Почему люди до такого "докатываются" и себя не ценят Зажрались мы (pardon my french) в столицах, однако ;) |
mikhailS, здесь я полностью согласен с господином Тумановым: заработок переводчика к геолокации не привязан, т.к. он web-based! Тут у всех совершенно равные возможности. Всё. теперь точно молчу:) Val61, простите за флуд в вашей ветке. |
Rami88, согласен, но с поправкой: заработок фрилансера к геолокации не привязан. |
У меня есть "знакомый знакомого". Но он берет 180 р/стр за верстку. Если надо, могу скинуть его координаты. |
AsIs, спасибо. За 180 не надо. Не тот случай. |
Вдруг кому интересно будет завершение этой истории. Плюс, я здесь и сейчас извиняюсь за задержку с ответом всем, кому до сих пор не ответил лично. 1. Начальство денег не дало. Все. Пепец. То ли пожмотничало, то ли еще чего, но это уже значения не играет и роли не имеет. Решаем вопрос, будем ли оттягивать по срокам в бесконечность (разверстать-перевести-сверстать взад "как было" страниц 100 у меня занимает примерно неделю) или Val61 пойдет искать себе другую работу. Месячишко еще побарахтаюсь, да и буду сваливать, пожалуй. 2. Нашел организацию, которая берет у тебя PDF (редактируемый ли, скан ли, неважно), извлекает голый текст, дает тебе в "кошку", забирает перевод и заверстывает обратно 1-в-1 за 60 рублей/страница за все про все, со скоростью 1 страница = 8 минут. При этом российское юр. лицо, облепленное в три слоя дипломами и сертификатами, NDA, миллион лет на рынке, репутация - толще некуда, рекомендации - чуть ли не из Кремля. Вдруг кому потребуется - пишите в личку. |
Val61, удачи в любом случае! |
Подскажите кто-нибудь, пожалуйста. Вот по этой ссылке можно конвертировать пдф в войрд. ttps://docs.zone/pdf-to-word А что делать, если русский вариант пдф файла вменяемый (кириллица), а при конвертации в этой программе (и вообще, при копировании текста из пдф в ворд) буквы значками вылазят. Это значит, что проблема в самом пдф файле, и ни одна программа не распознает нормально? |
да, скорее всего неправильно сделан pdf, поэтому и не воспроизводится из него кириллица |
Сделан как раз правильно, если у авторов стояла цель усложнить распознавание в текст. Рекомендую пересохранить pdf "как новый файл", проверить при этом опции, и попробовать снова. |
Сохранить файл Ворд в PDF: Файл > Сохранить как > PDF. Кажется, всё сохраняется. Досконально не проверял. |
чтобы усложнить, нужно включить защиту часто кириллица неправильно воспроизводится, например, в pdf-xchange printer, если при создании pdf включить дополнительное сжатие Да, последние ms офисы делают pdf весьма четко |
помнится когда-то давно была ключевая опция имбеднуть фонты |
Вопрос: Можно конвертировать пдф в ворд? Ответ: Сохранить файл Ворд в PDF: Файл > Сохранить как > PDF. ... Ma_linka, а картинка (снапшот) из пдф в ворд копируется? Может быть, он просто зашифрован у вас? Его можно попробовать расшифровать в таком случае. |
кто-нибудь использует функцию Print to File? Мне так и не довелось ей ни разу воспользоваться, не возникало необходимости. В описанном выше случая, возможно. пригодится. |
Не знаю, говорит это о чем-то или нет, но в свойствах док-та говорится, что он был создан в PDF (версия 1.5 Acrobat 6.x), производитель проги Acrobat Distiller 10.1.1. (Windows), также говорится, что защиты нет, компоновка док-та и извлечение страниц запрещены. Картинка из пдф в ворд копируется, английский текст тоже, а русский - загогулинами. Какие опции надо перепроверить при пересохранении файла пдф? Часто такая фигня выходит с пдф файлами. FineReader и др. распознавательные-преобразовательные проги эту проблему решают? Не прикупить ли - сейчас вроде на Abby продукты скидки... |
FineReader и др. распознавательные-преобразовательные проги эту проблему решают? Чтобы ответить, надо попробовать. Чтобы попробовать, надо проблемный файл заполучить. Вы готовы дать этот файл под честное пионерское слово? |
в прошлом на сайте ABBYY можно было бесплатно распознать в онлайн-режиме небольшой объем текста, попробуйте. |
если в pdf-документе текст вставлен как текст, а не как скан, то какой смысл его отправлять в FineReader? Тот ведь производит оптическое распознавание символов. А что тут распознавать, когда символы просто не в той кодировке оказались? Причин неправильного кодирования может быть множество, начиная от неправильных шрифтов и кончая неправильными региональными настройками на компьютере. Я бы рекомендовал извлечь из pdf русский текст, если он представлен какими-то иными, но разными символами, а не знаками вопроса, и подсунуть какому-нибудь онлайн-конвертеру, например, Артемия Лебедева, тот автоматом правильно распознает, что за русский текст подразумевался. А заодно и расскажет, из какой кодировки его пришлось преобразовывать в нормальную. По поводу Print to File, Aiduza, я не совсем понял. Это давно уже не нужно, только для каких-то отладочных целей. Сейчас уже нет проблем сделать pdf либо из MS Office/LibreOffice/WPS и т.п., либо, воспользовавшись программами, устанавливающими в Windows виртуальный принтер, "печать" на котором и создает pdf. Acrobat Distiller это один из таких виртуальных принтеров. Но есть масса бесплатных, некоммерческих приложений, тот же PDF-Xchange Viewer pdfcreator, etc. |
если в pdf-документе текст вставлен как текст, а не как скан, то какой смысл его отправлять в FineReader? Для сохранения исходного формата. Особенно, если нужно заменить исходный "коммерческий" шрифт на системный. Я мог бы прямо сейчас показать вам редактируемый ПДФ, который необходимо обработать в Файнридере и заново пересохранить в редактируемый ПДФ потому, что иначе Инфикс его не берет и творит с ним свои собственные кракозябры. И у меня таких документов - около 80% общей загрузки. |
Вот это было бы полезно. Я не умею (ПДФ-ФР-ПДФ). Будем ждать. |
Редактирование pdf это все-таки ересь, как бы не совершенствовались механизмы этой ереси. Конечно, всегда можно превратить pdf с текстовым слоем в картинку, затем эту картинку рапознать и заново сделать pdf, но как же это все странно. Ведь достаточно просто отредактировать оригинал того документа, из которого получился "кривой" pdf. Я считаю, что во многом вина исполнителей таких заказов, что они не настаивают на предоставлении исходных материалов, а довольствуются ущербными pdf в качестве исходников. Мне приходилось иметь дело с переводчиками, которые прямо настаивали на распознавании pdf в Transformer+, чтобы его потом переводить в Word. Что за радость тратить несколько часов на переформатирование текста в Word после его "интеллектуального" распознавания вместо того, чтобы его просто начисто набрать. Тем более это глупо, если переведенный текст все равно потом заказчиком будет сверстан заново. |
|
link 5.03.2015 9:51 |
ABBYY PDF Transformer 2.0 если хотите оставьте тут мыло, вышлю с кряком, проверен и безопасен |
archimedis - предупреждение |
Радость иногда заключается в том, что тебе прислали сканированный в пдф устав Кипра, ты час его распознавал, потом 15 минут "переводил" 50 страниц через САТ. Можно, конечно, и просто начисто набрать, но тогда про САТ можно забыть. |
зачастую легче распознать pdf-документ в режиме "текст без форматирования", после чего быстренько отформатировать его в MS Word-е. |
наблюдал несколько раз ошибки в работе Традоса при открытии в нем документа Word, полученного из Transformer+ Один "кривой" тэг в файле кладет CAT на лопатки Насчет "без форматирования" полностью согласен |
Aiduza, +150 |
alk, Memsource ест такие файлы и не давится. |
Ну это уже издержки Transformer+, наверное. С ФР пока никаких проблем не было. А кривые тэги можно и поудалять. |
|
link 5.03.2015 10:40 |
alk- благодарю, больше не повторится |
|
link 5.03.2015 10:51 |
- А если по скайп конференции созвониться, вы сможете демонстрацию экрана включить и в фотошопе наброски делать по тому, что будет говорить заказчик? (c) |