Subject: OFF: PDF Подскажите кто-нибудь как сканированный документ PDF можно перевести в word.Заранее спасибо |
Открыть его FineReaderом распознать текст и сохранить в word |
я так сделала, но текст весь искаженный, особенно формулы и таблицы |
а таблицы надо разметить ручками |
А дальше править вручную. Но! При распознавании в ФР не запускать тупо "распознать все", а каждую таблицу выделить и потом распознать как таблицу, формулу выделить как картинку (или потом набивать в ворде в редакторе формул вручную). Увы, других способов не существует. Еще есть программка Solid Converter PDF, но если у вас в ПДФ на самом деле не ПДФ, а скан картинки, то не поможет. |
ну я так и делаю сижу и вбиваю до тошноты, a что делать кому щас легко, думаем, что в сказку попали, ан нет, научились создавать проблемы так и решать приходится самим, так уж видимо этот мир устроен, увы! |
если текст сосканирован как картинка - тогда имхо полная ж..а, обычно тупо распечатываю |
да так и есть сплошной сканер, во "повезло", так "повезло"! |
с Fine Reader пробовал один раз - пополнил запас ненормативной лексики в разы и теперь как только вижу скан картинки в PDF - без размышлений - в печать |
Есть еще фигня, называется Кleptomania. Распознает скриншоты. Я себе не далее как сегодня установил ейный триал на месяц, но на акробатах не пробовал. Завтра гляну. Но предварительно... С экрана ИЕ читает хреново, с массой ошибок, латинские буквы, зараза, пропускает. Что касается FR, Val 61 прав. Надо каждую страницу чистить и смотреть. Распознавать таблицы как таблицы (предварительно "анализировав" ейные структуры), текст как текст. А тупо тыкать "распозднать усё" - это, конечно, быстро, но себе проблемы создавать. Неизвестно, что лучше. |
"триал" меня очаровал! |
а я юзаю ABBYY screenshot reader + просто картинки из ПДФ acrobat reader'ом. Плюс бесценный помощник - это PDFedit от компании Foxit. Старые версии вообще бесплатны. |
Зла не хватает! На дворе 21-й век, а документы на перевод шлют в сканированных ПДФ-ах. Это традиция - о переводчиках просто никто не думает. |
А Paint помогает реально! Очень удобная программа! |
А пробовали SolidPDFconverter? Бодро перегоняет пдфки в ворд, сохраняя форматирование. |
Дык то для нормальных ПДФ-ов, а не для сканов. Хотя с нормальными ПДФ-ами переводчику тоже не сладко из-за всевозможных врезов текста и графики, колонок и др. элементов украшательства |
Arandela, где можно скачать беспроблемно SolidPDFconverter? ФР стоит на офисной машине, лицензионный, а дома... Искать, чесгря боюсь... Вирусов наловлю. kondorsky, если у вас ФР, и если сканите, задавайте конечный формат как пдф, а не как тиф и не "родной" формат сканнера. Тогда легше. Колонки, графики, картинки - хелп читайте. Там все написано. |
Sjoe!, могу попытаться скинуть Вам на ящик зараренную папку с SolidPDFconverter и патчем. "Попытаться", потому что весит 18 метров. Надо? |
Надо, СПС большое. другой вопрос, пролезет ли. Может, на обменнике выложить? Однако попробуйте сначала, есле не в лом. sjoe на яндексе. |
Ну на торрентсе тоже есть. Franky, а у вас 5ая версия? У меня 4. Интересно, много ли они там "наулучшали" и стоит ли 4 на 5 менять? |
Arandela, у меня 5-ая. Sjoe!, посылка ушла. |
А что, Acrobat Reader 8 и далее уже разучился PDF в Word экспортировать? Или я чего-то не понимаю? |
Это если пдф электрически приходит, то проблем нет (или почти нет) А если на бумажке, то хардкопи сканить надо, и не факт, что каждый сканер эго в пдф выдаст. По умолчанию он его в свой родной формат выдаст (не обязательно в пдф или сразу в Ворд, между прочим). А эти родные (типа старого Айриса) такие экзотические бывают... Вот, к примеру, у меня стоит пропатченный триал KanjiScan для OCR японского (хорошая штука; кстати, лицензионный стоил около штуки баксов, мы б его купили, но их, к сожалению, больше не выпускают). Так вот, он выдает продукт чер-те в какой кодировке (похоже, для старых чисто японских Виндов, но никто точно не знает, я уже всех, кого можно опросил). Я таки нашел способ - перегонять его через два формата и экспортировать в Ворд. Я к тому, что затык получается на этапе продукта сканирования, на не распознования. |
*но не собственно распознавания (пдф). |
RE: А что, Acrobat Reader 8 и далее уже разучился PDF в Word экспортировать? ежели ПДФ сканированный, то его сначала распознать надо. Acrobat Reader (Any number you like) может его и Ворд экспортировать, наверно, но только в виде картинки == Мне, кстати, присылали на перевод такие вордовские файлы, внутри которых просканированные картинки вместо текста... |
А еще бывают ПДФ с текстовым слоем, в которые забыли шрифты встроить, а исходные шрифты в хз какой кодировке стояли. В результате любой экспорт дает кракозябы - тоже приходится распознаванием брать |
Плавали, знаем! (с) Приходит "вордовский" файл весом тонн так 30, состоящий из картинок текста размером А4. Или, скажем, нормальный с виду пдф с нормальной кириллицей или латиницей (все вроде читается). Но распечатывается он в грузинском, блин, шрифте, как ты не принтер не настраивай, и не распознается вообще! Я попросил сисадмина удалить мне все нелатинские и некириллические фонты. "Низя", был ответ. "Политико, однако". А я дыру нашел и все равно их сдул. Их (грузинских и армянских фонтов) было по "политике" натыкано больше сотни. |
Надо, СПС большое. другой вопрос, пролезет ли. Может, на обменнике выложить? Однако попробуйте сначала, есле не в лом. sjoe на яндексе. |
Ну, шкипер, ну влистил, ну СПАСИИИИИИИБО!! |
Enote Ну, не знаю. Только что скачал жуткий ПДФ-скан (с кривыми строками и рукописными пометками) огромного 500-страаничного текста одной редкой книжки на русском. http://narod.ru/disk/5351128000/hosu-text.pdf.html Чистая графика, никаких шрифтов вообще. 9-й ридер легко сохранил его в txt . Сейчас попробую в 8-м экспортнуть в вордовский док. (Кстати, весьма рекомендую интересующимся историей и Японией) |
2 CSB Ради интереса скачал этого Хосю. Файл конечно сканированный, но с текстовым слоем (я элементарно выделяю в нем символы/слова/фразы). Т.е. кто-то его уже распознал. А шрифтов в нем аж 9 штук устанвлено Так что не верь глазам своим :) |
СSB, СПС за сцылку. Видел книшку у букинистов, но цена была запредельная. Экспортируется после чистки и "обработки текста". Вопрос только, а оно вам нуна? Я его как есть распечатаю и в байндер переплету. |
В дополнение к этой книге рекомендую типа-sequel 井上靖 おろしや国酔夢譚, Oroshia Koku Suimutan (Ясуси Иноуэ, "Сны о России", выходила в неплохом русском переводе). Модный (и не очень профессионально переведенный) Мураками отдыхает. |
Sjoe! Спасибо за наводку. Поищу. |
Welcome & help yourself. На www.alib.ru (только что снял, ссылка всю страницу не дает, только бланк запроса) Ясуси Иноуэ. Сны о России. Москва Наука 1977г. 232с. Мягкий картон переплет, обычный формат. 210гр. Иноуэ Ясуси. Сны о России. М Наука 1980г. 232 с.,ил Мягкий переплет, Обычный формат. Информацию о скидках смотрите в профайле Иноуэ Ясуси. Сны о России. М. Наука 1980г. 232 с. мягкий переплет, обычный формат. Иноуэ Ясуси. Сны о России.Роман.рассказы. Пер с яп.Предисл.Григорьевой Т.П. М Наука 1987г. 473с Мягкий переплет, Обычный формат. Иноуэ Ясуси. Сны о России. Москва Наука 1987г. 473с. Мягкий переплет, Обычный формат. Иноуэ Я. Сны о России. Перевод с японского Б.В. Раскина М. Наука 1977г. 231 с. Мягкий (бумажный) переплет, обычный формат. Иноуэ Ясуси. Сны о России. Роман. Рассказы. Пер. с япон. М Наука. 1987г. 473 с. мягкий переплет, обычный формат. Иноуэ Ясуси. Сны о России. М., Главная редакция восточной литературы, Наука 1977г. 230 стр. Мягкая издательская обложка Обычный формат. Иноуэ Ясуси. Сны о России. М., Главная редакция восточной литературы, Наука 1977г. 230 стр. Мягкая издательская обложка Обычный формат. Иноуэ Ясуси. Сны о России. Исторический роман, 18 век, пер. с японского. М Наука 1977г. 232с. Мягкий переплет, Обычный формат. Цена с доставкой Ясуси Иноуэ. Сны о России. М Наука 1980г. 232 с мягкий переплет, обычный формат. Доставка по РФ бесплатная ( никаких доплат) Ясуси Иноуэ. Сны о России. Наука 1980г. 232 с Мягкий. переплет, Обычный. формат. Цена с доставкой+7% с наложенного платежа. Ясусси Иноуэ. Сны о России. `Пер. с яп. Б.В.Раскина, Предисл. И.Фонякова` М. ГРВЛ 1980г. 232 с. бумажный переплет, обычный формат. Ясуси Иноуэ. Сны о России. Перевод с японского В. В. Раскина. Предисловие И. Фонякова. Москва. Наука. Главная редакция восточной литературы. 1977г. 232 с. Мягкий переплет, Обычный формат. |
:) Разброс цен - 80р - 1400 р. Рынок, однако! :) |
You need to be logged in to post in the forum |