DictionaryForumContacts

 lanaprima

link 22.02.2009 16:32 
Subject: OFF: PDF
Подскажите кто-нибудь как сканированный документ PDF можно перевести в word.

Заранее спасибо

 segu

link 22.02.2009 16:46 
Открыть его FineReaderом распознать текст и сохранить в word

 lanaprima

link 22.02.2009 17:11 
я так сделала, но текст весь искаженный, особенно формулы и таблицы

 Enote

link 22.02.2009 18:04 
а таблицы надо разметить ручками

 Val61

link 22.02.2009 18:05 
А дальше править вручную. Но! При распознавании в ФР не запускать тупо "распознать все", а каждую таблицу выделить и потом распознать как таблицу, формулу выделить как картинку (или потом набивать в ворде в редакторе формул вручную). Увы, других способов не существует. Еще есть программка Solid Converter PDF, но если у вас в ПДФ на самом деле не ПДФ, а скан картинки, то не поможет.

 lanaprima

link 22.02.2009 20:21 
ну я так и делаю сижу и вбиваю до тошноты, a что делать кому щас легко, думаем, что в сказку попали, ан нет, научились создавать проблемы так и решать приходится самим, так уж видимо этот мир устроен, увы!

 Denisska

link 22.02.2009 20:28 
если текст сосканирован как картинка - тогда имхо полная ж..а, обычно тупо распечатываю

 lanaprima

link 22.02.2009 20:33 
да так и есть сплошной сканер, во "повезло", так "повезло"!

 Denisska

link 22.02.2009 20:37 
с Fine Reader пробовал один раз - пополнил запас ненормативной лексики в разы и теперь как только вижу скан картинки в PDF - без размышлений - в печать

 Sjoe! moderator

link 22.02.2009 20:39 
Есть еще фигня, называется Кleptomania. Распознает скриншоты. Я себе не далее как сегодня установил ейный триал на месяц, но на акробатах не пробовал. Завтра гляну. Но предварительно... С экрана ИЕ читает хреново, с массой ошибок, латинские буквы, зараза, пропускает.

Что касается FR, Val 61 прав. Надо каждую страницу чистить и смотреть. Распознавать таблицы как таблицы (предварительно "анализировав" ейные структуры), текст как текст. А тупо тыкать "распозднать усё" - это, конечно, быстро, но себе проблемы создавать. Неизвестно, что лучше.
Формулы можно вообще из акробата в Ворд перенесть в оригинальном виде, "сфотографировав", если заказчик потерпит. Вплоть до подписей и логотипов. Ну, можно слегка в Пейнте почистить.
В общем, работа рашпилем (с)
Я так клиентские счета делал одно время. Потом забил и создал точную копию счета в Ворде на все времена.

 c_khrytch

link 22.02.2009 22:28 
"триал" меня очаровал!

 axpamen

link 23.02.2009 4:28 
а я юзаю ABBYY screenshot reader + просто картинки из ПДФ acrobat reader'ом. Плюс бесценный помощник - это PDFedit от компании Foxit. Старые версии вообще бесплатны.

 kondorsky

link 23.02.2009 6:09 
Зла не хватает! На дворе 21-й век, а документы на перевод шлют в сканированных ПДФ-ах. Это традиция - о переводчиках просто никто не думает.

 kondorsky

link 23.02.2009 6:10 
А Paint помогает реально! Очень удобная программа!

 Arandela

link 23.02.2009 7:25 
А пробовали SolidPDFconverter? Бодро перегоняет пдфки в ворд, сохраняя форматирование.

 kondorsky

link 23.02.2009 7:32 
Дык то для нормальных ПДФ-ов, а не для сканов. Хотя с нормальными ПДФ-ами переводчику тоже не сладко из-за всевозможных врезов текста и графики, колонок и др. элементов украшательства

 Sjoe! moderator

link 23.02.2009 7:47 
Arandela, где можно скачать беспроблемно SolidPDFconverter? ФР стоит на офисной машине, лицензионный, а дома... Искать, чесгря боюсь... Вирусов наловлю.

kondorsky, если у вас ФР, и если сканите, задавайте конечный формат как пдф, а не как тиф и не "родной" формат сканнера. Тогда легше. Колонки, графики, картинки - хелп читайте. Там все написано.

 Franky

link 23.02.2009 8:06 
Sjoe!, могу попытаться скинуть Вам на ящик зараренную папку с SolidPDFconverter и патчем. "Попытаться", потому что весит 18 метров. Надо?

 Sjoe! moderator

link 23.02.2009 8:09 
Надо, СПС большое. другой вопрос, пролезет ли. Может, на обменнике выложить? Однако попробуйте сначала, есле не в лом. sjoe на яндексе.

 Arandela

link 23.02.2009 8:26 
Ну на торрентсе тоже есть.
Franky, а у вас 5ая версия? У меня 4. Интересно, много ли они там "наулучшали" и стоит ли 4 на 5 менять?

 Franky

link 23.02.2009 8:29 
Arandela, у меня 5-ая.

Sjoe!, посылка ушла.

 CSB

link 23.02.2009 10:10 
А что, Acrobat Reader 8 и далее уже разучился PDF в Word экспортировать? Или я чего-то не понимаю?

 Sjoe! moderator

link 23.02.2009 10:28 
Это если пдф электрически приходит, то проблем нет (или почти нет) А если на бумажке, то хардкопи сканить надо, и не факт, что каждый сканер эго в пдф выдаст. По умолчанию он его в свой родной формат выдаст (не обязательно в пдф или сразу в Ворд, между прочим). А эти родные (типа старого Айриса) такие экзотические бывают...
Вот, к примеру, у меня стоит пропатченный триал KanjiScan для OCR японского (хорошая штука; кстати, лицензионный стоил около штуки баксов, мы б его купили, но их, к сожалению, больше не выпускают). Так вот, он выдает продукт чер-те в какой кодировке (похоже, для старых чисто японских Виндов, но никто точно не знает, я уже всех, кого можно опросил). Я таки нашел способ - перегонять его через два формата и экспортировать в Ворд.
Я к тому, что затык получается на этапе продукта сканирования, на не распознования.

 Sjoe! moderator

link 23.02.2009 10:30 
*но не собственно распознавания (пдф).

 Enote

link 23.02.2009 10:42 
RE: А что, Acrobat Reader 8 и далее уже разучился PDF в Word экспортировать?
ежели ПДФ сканированный, то его сначала распознать надо. Acrobat Reader (Any number you like) может его и Ворд экспортировать, наверно, но только в виде картинки
==
Мне, кстати, присылали на перевод такие вордовские файлы, внутри которых просканированные картинки вместо текста...

 Enote

link 23.02.2009 10:45 
А еще бывают ПДФ с текстовым слоем, в которые забыли шрифты встроить, а исходные шрифты в хз какой кодировке стояли. В результате любой экспорт дает кракозябы - тоже приходится распознаванием брать

 Sjoe! moderator

link 23.02.2009 11:00 
Плавали, знаем! (с) Приходит "вордовский" файл весом тонн так 30, состоящий из картинок текста размером А4. Или, скажем, нормальный с виду пдф с нормальной кириллицей или латиницей (все вроде читается). Но распечатывается он в грузинском, блин, шрифте, как ты не принтер не настраивай, и не распознается вообще!
Я попросил сисадмина удалить мне все нелатинские и некириллические фонты. "Низя", был ответ. "Политико, однако". А я дыру нашел и все равно их сдул. Их (грузинских и армянских фонтов) было по "политике" натыкано больше сотни.

 tumanov

link 23.02.2009 19:23 
Надо, СПС большое. другой вопрос, пролезет ли. Может, на обменнике выложить? Однако попробуйте сначала, есле не в лом. sjoe на яндексе.

www.yousendit.com

 Sjoe! moderator

link 23.02.2009 19:52 
Ну, шкипер, ну влистил, ну СПАСИИИИИИИБО!!

 CSB

link 24.02.2009 12:42 
Enote
Ну, не знаю.
Только что скачал жуткий ПДФ-скан (с кривыми строками и рукописными пометками) огромного 500-страаничного текста одной редкой книжки на русском.
http://narod.ru/disk/5351128000/hosu-text.pdf.html
Чистая графика, никаких шрифтов вообще. 9-й ридер легко сохранил его в txt . Сейчас попробую в 8-м экспортнуть в вордовский док.
(Кстати, весьма рекомендую интересующимся историей и Японией)

 Enote

link 24.02.2009 14:40 
2 CSB
Ради интереса скачал этого Хосю. Файл конечно сканированный, но с текстовым слоем (я элементарно выделяю в нем символы/слова/фразы). Т.е. кто-то его уже распознал.
А шрифтов в нем аж 9 штук устанвлено
Так что не верь глазам своим :)

 Sjoe! moderator

link 24.02.2009 15:03 
СSB, СПС за сцылку. Видел книшку у букинистов, но цена была запредельная.
Экспортируется после чистки и "обработки текста".
Вопрос только, а оно вам нуна? Я его как есть распечатаю и в байндер переплету.

 Sjoe! moderator

link 24.02.2009 16:13 
В дополнение к этой книге рекомендую типа-sequel 井上靖 おろしや国酔夢譚, Oroshia Koku Suimutan (Ясуси Иноуэ, "Сны о России", выходила в неплохом русском переводе). Модный (и не очень профессионально переведенный) Мураками отдыхает.

 CSB

link 24.02.2009 16:21 
Sjoe!
Спасибо за наводку. Поищу.

 Sjoe! moderator

link 24.02.2009 16:30 
Welcome & help yourself. На www.alib.ru (только что снял, ссылка всю страницу не дает, только бланк запроса)

Ясуси Иноуэ. Сны о России. Москва Наука 1977г. 232с. Мягкий картон переплет, обычный формат. 210гр.
(Продавец: BS - Genrik, Ростов-на-Дону.) Цена 80 руб. Заказать
Роман о первых японцах, побывавших на русской земле (XVIII в.) и о зарождении русско-японских отношений
Cостояние: хорошее

Иноуэ Ясуси. Сны о России. М Наука 1980г. 232 с.,ил Мягкий переплет, Обычный формат. Информацию о скидках смотрите в профайле
(Продавец: BS - bukinist_ufa, Уфа.) Цена 80 руб. Заказать
Роман повествует о первых японцах, оказавшихся в результате кораблекрушения на русской земле. Книга содержит также рассказы о жизни послевоенной Японии.
Cостояние: Отличное

Иноуэ Ясуси. Сны о России. М. Наука 1980г. 232 с. мягкий переплет, обычный формат.
(Продавец: BS - BookSamara, Самара.) Цена 100 руб. Заказать
Роман о первых японцах, оказавшихся в результате кораблекрушения на русской земле, о трудностях их жизни в условиях сурового сибирского существования, о зарождении русско-японских отношений. Любопытны картины России екатерининских времен, увиденной глазами японца. Рассказы - Годовщина свадьбы. Сад камней. И смерть, и любовь, и волны морские. Охотничье ружье. Бой быков. Цветущая слива в Ина. Обасутэяма - гора, где оставляют старух. Азалии в Хира. Путешествие к святой земле. Давнишний благодетель. Цветочная пыльца. Хосуй Хара - подделыватель картин
Cостояние: очень хорошее, чуть помят нижний уголок задней обложки

Иноуэ Ясуси. Сны о России.Роман.рассказы. Пер с яп.Предисл.Григорьевой Т.П. М Наука 1987г. 473с Мягкий переплет, Обычный формат.
(Продавец: BS - Samara, Самара.) Цена 100 руб. Заказать
Зарождение русско-японских отношений.
Cостояние: Хорошее

Иноуэ Ясуси. Сны о России. Москва Наука 1987г. 473с. Мягкий переплет, Обычный формат.
(Продавец: BS - KOSTEN, Ростов-на-Дону.) Цена 120 руб. Заказать
Cостояние: Очень хорошее

Иноуэ Я. Сны о России. Перевод с японского Б.В. Раскина М. Наука 1977г. 231 с. Мягкий (бумажный) переплет, обычный формат.
(Продавец: BS - Коллекционер, Челябинск.) Цена 120 руб. Заказать
Роман о первых японцах, побывавших на русской земле (XVIII в.) и о зарождении русско-японских отношений. Сканы по запросу.
Cостояние: Отличное. Штампы расформированной библиотеки

Иноуэ Ясуси. Сны о России. Роман. Рассказы. Пер. с япон. М Наука. 1987г. 473 с. мягкий переплет, обычный формат.
(Продавец: BS - Anfisa, Тверская обл.) Цена 150 руб. Заказать
Роман о первых японцах, оказавшихся в результате кораблекрушения на русской земле, о трудностях их жизни в условиях сурового сибирского существования, о зарождении русско-японских отношений. Любопытны картины России екатерининских времен, увиденной глазами японца. Рассказы - Годовщина свадьбы. Сад камней. И смерть, и любовь, и волны морские. Охотничье ружье. Бой быков. Цветущая слива в Ина. Обасутэяма - гора, где оставляют старух. Азалии в Хира. Путешествие к святой земле. Давнишний благодетель. Цветочная пыльца. Хосуй Хара - подделыватель картин.
Cостояние: очень хорошее, немного потерта обложка

Иноуэ Ясуси. Сны о России. М., Главная редакция восточной литературы, Наука 1977г. 230 стр. Мягкая издательская обложка Обычный формат.
(Продавец: BS - gornitsa, Новосибирск.) Цена 150 руб. Заказать
Роман о первых японцах, побывавших на русской земле (XVIII в.) и о зарождении русско-японских отношений.
Cостояние: Идеальное
Смотрите: посмотреть посмотреть

Иноуэ Ясуси. Сны о России. М., Главная редакция восточной литературы, Наука 1977г. 230 стр. Мягкая издательская обложка Обычный формат.
(Продавец: BS - gornitsa, Новосибирск.) Цена 150 руб. Заказать
Роман о первых японцах, побывавших на русской земле (XVIII в.) и о зарождении русско-японских отношений.
Cостояние: Идеальное

Иноуэ Ясуси. Сны о России. Исторический роман, 18 век, пер. с японского. М Наука 1977г. 232с. Мягкий переплет, Обычный формат. Цена с доставкой
(Продавец: BS - Orlik2, Петрозаводск и др..) Цена 170 руб. Заказать
Cостояние: Хорошее.Высылается из Ельца.

Ясуси Иноуэ. Сны о России. М Наука 1980г. 232 с мягкий переплет, обычный формат. Доставка по РФ бесплатная ( никаких доплат)
(Продавец: BS - Orlik, Карелия, г. Петрозаводск.) Цена 250 руб. Заказать
Cостояние: хор.

Ясуси Иноуэ. Сны о России. Наука 1980г. 232 с Мягкий. переплет, Обычный. формат. Цена с доставкой+7% с наложенного платежа.
(Продавец: BS - barry191, Волгоград.) Цена 300 руб. Заказать
Cостояние: Хорошее.

Ясусси Иноуэ. Сны о России. `Пер. с яп. Б.В.Раскина, Предисл. И.Фонякова` М. ГРВЛ 1980г. 232 с. бумажный переплет, обычный формат.
(Продавец: BS - Knight, ) Цена 330 руб. Заказать
Cостояние: удовлетворительное, библ.штампы

Ясуси Иноуэ. Сны о России. Перевод с японского В. В. Раскина. Предисловие И. Фонякова. Москва. Наука. Главная редакция восточной литературы. 1977г. 232 с. Мягкий переплет, Обычный формат.
(Продавец: BS - Forward, Москва.) Цена 1400 руб. Заказать
Cостояние: очень хорошее.

 CSB

link 25.02.2009 6:56 
:) Разброс цен - 80р - 1400 р.
Рынок, однако! :)

 

You need to be logged in to post in the forum