DictionaryForumContacts

 Val61

1 2 all

link 25.08.2014 12:38 
Subject: Верстка PDF в Word и обратно. Нужен совет по исполнителю. gen.
Нужно разверстать из PDF в Ворд и потом сверстать обратно в PDF примерно 3000 (три тысячи) страниц. Исходные файлы в основном редактируемые, но прямое сохранение в Ворд Акробатом и/или попытка выгнать xml в Инфиксе приводят к необходимости объемистого доформатирования перевода вручную. Т.к. работы много, сам не справляюсь, начальство согласилось выделить денежку и привлечь стороннего верстальщика.

Буду признателен за рекомендации и если кто-нибудь примерно сориентирует по расценкам. Можно в личку.

Заранее спасибо.

 tumanov

link 25.08.2014 14:14 
Добрый день!

могу взяться за работу *есть специалист, да и сам не криворук
подрядчиком может выступить юрлицо из эстонии (инвойс, все как у взрослых) или физическое лицо из России

ставки более чем разумные
подробнее прошу писать мне на serg_tumanov"hotmail.com

 Erdferkel

link 25.08.2014 14:49 
а вот этим не пробовали?
http://pdfburger.com/pdf-to-word
если PDF не графика, формат прекрасно сохраняется

 Пан

link 25.08.2014 16:38 
К сожалению, доформатирования требует не только графика, но и таблицы, хедеры, футеры и прочий мусор, которого в любом PDF полным полно.

 tumanov

link 25.08.2014 17:24 
Это же к счастью!

 Val61

link 25.08.2014 18:39 
Дело не в инструментах. Инструменты имеются. Проблема с большим объемом работы и относительно ограниченными сроками. У меня есть еще и другая работа.

Самое главное, удалось выяснить, что "в среднем по больнице, включая морг", ставка крутится вокруг 30 рублей за страницу первичной верстки и столько же - за верстку перевода. Некоторые, правда, просят 70 за "в одну сторону". В общем, пойду объяснять начальству, что конкретно означает "дадим денег". Когда дадут, буду думать, кому их отдать. Есть вариант, что зажмотятся и согласятся сдвинуть срок до Нового года. Тоже сгодится.

 fayzee

link 25.08.2014 19:07 
за такие деньги они сами сверстают ...

 ttimakina

link 25.08.2014 19:47 
Я тоже могу взяться. Но за более разумные деньги, чем 30 руб/стр. ИП нет.

 Val61

link 25.08.2014 20:15 
за такие деньги они сами сверстают ...

"Они сами" - это я и есть. Увы, ситуация такова, что доп. премию лично мне конкретно вот за это не выпишут. Максимум, что могу сделать, это кликнуть кличЪ у себя в офисе, вдруг найдутся энтузиасты подхалтурить "в свободное от исполнения основных служебных обязанностей время". За премию. Просто как вариант. И деньги отдать своим в виде премии проще, чем перечислять куда-то по договору, NDA подписывать и вообще гимор эйчарне и бухгалтерии устраивать.

2 ttimakina: Вот, в исходнике слова "Roller Bearing Seat Surface". Знаков с пробелами - 27. Переводится, стало быть, как "Поверхность посадочного места роликового подшипника". Знаков с пробелами - 51. Нужно вписать в то же пространство. Не больше и не меньше. Стало быть, подгонять размер шрифта и/или расстояние между символами. Вжик-вжик, одна минута. Или полторы. Но подобных заморочек по всему массиву - несколько сотен тысяч. При этом размеры шрифтов разные, размеры текст-боксов тоже. Вы все еще готовы взяться, да еще и за "более разумные деньги"? Это же не просто так, что тупо загнал в распознавалку, тупо вынул и готово. Тут туча ручного труда. Если бы все было просто, я и не парился бы. Акробат у меня есть...

 fayzee

link 25.08.2014 20:34 
Геморр редкий, если конечно человек не одну собаку скушал на этом деле.
На той неделе тоже пришлось текст выравнивать - проклял всё на свете ...

 ttimakina

link 25.08.2014 21:14 
Val61, я на таком не одну свору собак съела. Не сомневаюсь, что справлюсь. Такой работы не боюсь. Вопрос в разумных сроках и оплате. Ну и прежде, чем подписываться, конечно, посмотреть примеры самых "злобных" страничек. Или лучше для вашего/моего спокойствия пару-тройку страниц как тест сделать.
Под более разумными имела в виду не 30 и даже не 70 руб/стр. ))

 Syrira

link 26.08.2014 7:48 
Вот просто реально интересно себе на будущее: кто это в Москве делает такую работу за 30 или даже за 70 р/стр.?

 Rami88

link 26.08.2014 7:49 
Syrira, ну а кто переводит за 90р/стр?
"Они среди нас"
:D

 Syrira

link 26.08.2014 7:54 
За 90 р/стр. переводит гугл с минимальным участием человека-исполнителя и большим участием форума МТ. Соответственно и верстальщик будет такой же, надо полагать.

 Rami88

link 26.08.2014 8:03 
Как правило, да, цена обратно пропорциональна качеству, но, знаете, не всегда. Может, не за 90, но за 150 встречались мне случаи, когда человек вполне толковый и переводит неплохо. Почему люди до такого "докатываются" и себя не ценят, другой вопрос, и не для этой ветки, посему умолкаю:)

 mikhailS

link 26.08.2014 8:12 
RE: Почему люди до такого "докатываются" и себя не ценят

Зажрались мы (pardon my french) в столицах, однако ;)
Может, в каком-нибудь "мухосранске" и 90 р/стр. вполне приемлемая плата..

 Rami88

link 26.08.2014 8:17 
mikhailS, здесь я полностью согласен с господином Тумановым: заработок переводчика к геолокации не привязан, т.к. он web-based! Тут у всех совершенно равные возможности.
Всё. теперь точно молчу:)
Val61, простите за флуд в вашей ветке.

 mikhailS

link 26.08.2014 8:25 
Rami88, согласен, но с поправкой: заработок фрилансера к геолокации не привязан.

 AsIs

link 26.08.2014 8:28 
У меня есть "знакомый знакомого". Но он берет 180 р/стр за верстку. Если надо, могу скинуть его координаты.

 Val61

link 26.08.2014 8:37 
AsIs, спасибо. За 180 не надо. Не тот случай.

 Val61

link 13.09.2014 20:06 
Вдруг кому интересно будет завершение этой истории. Плюс, я здесь и сейчас извиняюсь за задержку с ответом всем, кому до сих пор не ответил лично.

1. Начальство денег не дало. Все. Пепец. То ли пожмотничало, то ли еще чего, но это уже значения не играет и роли не имеет. Решаем вопрос, будем ли оттягивать по срокам в бесконечность (разверстать-перевести-сверстать взад "как было" страниц 100 у меня занимает примерно неделю) или Val61 пойдет искать себе другую работу. Месячишко еще побарахтаюсь, да и буду сваливать, пожалуй.

2. Нашел организацию, которая берет у тебя PDF (редактируемый ли, скан ли, неважно), извлекает голый текст, дает тебе в "кошку", забирает перевод и заверстывает обратно 1-в-1 за 60 рублей/страница за все про все, со скоростью 1 страница = 8 минут. При этом российское юр. лицо, облепленное в три слоя дипломами и сертификатами, NDA, миллион лет на рынке, репутация - толще некуда, рекомендации - чуть ли не из Кремля. Вдруг кому потребуется - пишите в личку.

 ttimakina

link 13.09.2014 21:29 
Val61, удачи в любом случае!

 Ma_linka

link 4.03.2015 7:58 
Подскажите кто-нибудь, пожалуйста.
Вот по этой ссылке можно конвертировать пдф в войрд.
ttps://docs.zone/pdf-to-word
А что делать, если русский вариант пдф файла вменяемый (кириллица), а при конвертации в этой программе (и вообще, при копировании текста из пдф в ворд) буквы значками вылазят. Это значит, что проблема в самом пдф файле, и ни одна программа не распознает нормально?

 Ma_linka

link 4.03.2015 7:59 

 alk moderator

link 4.03.2015 9:04 
да, скорее всего неправильно сделан pdf, поэтому и не воспроизводится из него кириллица

 ttimakina

link 4.03.2015 9:18 
Сделан как раз правильно, если у авторов стояла цель усложнить распознавание в текст. Рекомендую пересохранить pdf "как новый файл", проверить при этом опции, и попробовать снова.

 Kuno

link 4.03.2015 9:19 
Сохранить файл Ворд в PDF: Файл > Сохранить как > PDF. Кажется, всё сохраняется. Досконально не проверял.

 alk moderator

link 4.03.2015 9:22 
чтобы усложнить, нужно включить защиту
часто кириллица неправильно воспроизводится, например, в pdf-xchange printer, если при создании pdf включить дополнительное сжатие
Да, последние ms офисы делают pdf весьма четко

 jenny&co

link 4.03.2015 9:25 
помнится когда-то давно была ключевая опция имбеднуть фонты

 AsIs

link 4.03.2015 9:51 
Вопрос: Можно конвертировать пдф в ворд?
Ответ: Сохранить файл Ворд в PDF: Файл > Сохранить как > PDF.
...
Ma_linka, а картинка (снапшот) из пдф в ворд копируется? Может быть, он просто зашифрован у вас? Его можно попробовать расшифровать в таком случае.

 Aiduza

link 4.03.2015 9:56 
кто-нибудь использует функцию Print to File? Мне так и не довелось ей ни разу воспользоваться, не возникало необходимости. В описанном выше случая, возможно. пригодится.

 Ma_linka

link 4.03.2015 12:21 
Не знаю, говорит это о чем-то или нет, но в свойствах док-та говорится, что он был создан в PDF (версия 1.5 Acrobat 6.x), производитель проги Acrobat Distiller 10.1.1. (Windows), также говорится, что защиты нет, компоновка док-та и извлечение страниц запрещены.

Картинка из пдф в ворд копируется, английский текст тоже, а русский - загогулинами.

Какие опции надо перепроверить при пересохранении файла пдф?

Часто такая фигня выходит с пдф файлами. FineReader и др. распознавательные-преобразовательные проги эту проблему решают? Не прикупить ли - сейчас вроде на Abby продукты скидки...

 AsIs

link 4.03.2015 12:32 
FineReader и др. распознавательные-преобразовательные проги эту проблему решают?
Чтобы ответить, надо попробовать.
Чтобы попробовать, надо проблемный файл заполучить.
Вы готовы дать этот файл под честное пионерское слово?

 Aiduza

link 4.03.2015 12:36 
в прошлом на сайте ABBYY можно было бесплатно распознать в онлайн-режиме небольшой объем текста, попробуйте.

 alk moderator

link 4.03.2015 14:59 
если в pdf-документе текст вставлен как текст, а не как скан, то какой смысл его отправлять в FineReader? Тот ведь производит оптическое распознавание символов. А что тут распознавать, когда символы просто не в той кодировке оказались? Причин неправильного кодирования может быть множество, начиная от неправильных шрифтов и кончая неправильными региональными настройками на компьютере.
Я бы рекомендовал извлечь из pdf русский текст, если он представлен какими-то иными, но разными символами, а не знаками вопроса, и подсунуть какому-нибудь онлайн-конвертеру, например, Артемия Лебедева, тот автоматом правильно распознает, что за русский текст подразумевался. А заодно и расскажет, из какой кодировки его пришлось преобразовывать в нормальную.
По поводу Print to File, Aiduza, я не совсем понял. Это давно уже не нужно, только для каких-то отладочных целей. Сейчас уже нет проблем сделать pdf либо из MS Office/LibreOffice/WPS и т.п., либо, воспользовавшись программами, устанавливающими в Windows виртуальный принтер, "печать" на котором и создает pdf. Acrobat Distiller это один из таких виртуальных принтеров. Но есть масса бесплатных, некоммерческих приложений, тот же PDF-Xchange Viewer pdfcreator, etc.

 Val61

link 4.03.2015 22:10 
если в pdf-документе текст вставлен как текст, а не как скан, то какой смысл его отправлять в FineReader?

Для сохранения исходного формата. Особенно, если нужно заменить исходный "коммерческий" шрифт на системный. Я мог бы прямо сейчас показать вам редактируемый ПДФ, который необходимо обработать в Файнридере и заново пересохранить в редактируемый ПДФ потому, что иначе Инфикс его не берет и творит с ним свои собственные кракозябры. И у меня таких документов - около 80% общей загрузки.
Я как-нибудь выложу на ютюбе ролик и покажу.

 AsIs

link 5.03.2015 6:22 
Вот это было бы полезно. Я не умею (ПДФ-ФР-ПДФ). Будем ждать.

 alk moderator

link 5.03.2015 9:19 
Редактирование pdf это все-таки ересь, как бы не совершенствовались механизмы этой ереси.
Конечно, всегда можно превратить pdf с текстовым слоем в картинку, затем эту картинку рапознать и заново сделать pdf, но как же это все странно. Ведь достаточно просто отредактировать оригинал того документа, из которого получился "кривой" pdf.
Я считаю, что во многом вина исполнителей таких заказов, что они не настаивают на предоставлении исходных материалов, а довольствуются ущербными pdf в качестве исходников.
Мне приходилось иметь дело с переводчиками, которые прямо настаивали на распознавании pdf в Transformer+, чтобы его потом переводить в Word. Что за радость тратить несколько часов на переформатирование текста в Word после его "интеллектуального" распознавания вместо того, чтобы его просто начисто набрать. Тем более это глупо, если переведенный текст все равно потом заказчиком будет сверстан заново.

 archimedis

link 5.03.2015 9:51 
ABBYY PDF Transformer 2.0 если хотите оставьте тут мыло,
вышлю с кряком, проверен и безопасен

 alk moderator

link 5.03.2015 10:17 
archimedis - предупреждение

 AsIs

link 5.03.2015 10:30 
Радость иногда заключается в том, что тебе прислали сканированный в пдф устав Кипра, ты час его распознавал, потом 15 минут "переводил" 50 страниц через САТ.
Можно, конечно, и просто начисто набрать, но тогда про САТ можно забыть.

 Aiduza

link 5.03.2015 10:32 
зачастую легче распознать pdf-документ в режиме "текст без форматирования", после чего быстренько отформатировать его в MS Word-е.

 alk moderator

link 5.03.2015 10:33 
наблюдал несколько раз ошибки в работе Традоса при открытии в нем документа Word, полученного из Transformer+
Один "кривой" тэг в файле кладет CAT на лопатки
Насчет "без форматирования" полностью согласен

 ttimakina

link 5.03.2015 10:35 
Aiduza, +150

 ttimakina

link 5.03.2015 10:36 
alk, Memsource ест такие файлы и не давится.

 AsIs

link 5.03.2015 10:40 
Ну это уже издержки Transformer+, наверное. С ФР пока никаких проблем не было. А кривые тэги можно и поудалять.

 archimedis

link 5.03.2015 10:40 
alk- благодарю, больше не повторится
- А если по скайп конференции созвониться, вы сможете демонстрацию экрана включить и в фотошопе наброски делать по тому, что будет говорить заказчик? (c)

Get short URL | Pages 1 2 all