DictionaryForumContacts

 ttimakina

1 2 all

link 20.11.2012 15:25 
Subject: OFF: системы автоматического перевода gen.
Коллеги, вышел спор, переходящий в рукопашную :) Пожалуйста, помогите разрешить. Для этого ответьте на вопрос - используете ли вы системы автоматического перевода и какой прмерно процент работы вы в них выполняете (допустим, в среднем за год).
Мне кажется, что больше всего такие программы полезны для "юристов". Это так?

 edasi

link 20.11.2012 15:53 
не существует машинного перевода
машинный перевод невозможен в принципе
машинный перевод это оксюморон

 ttimakina

link 20.11.2012 15:58 
edasi, тут даже спорить не о чем :) вопрос не в этом

 ttimakina

link 20.11.2012 15:59 
Я имела в виду TRADOS и прочие из этого семейства.

 алешаBG

link 20.11.2012 16:02 
Q. Это так?
A. Нет
машинный перевод - это оксюморон, конечно, so far....

TRADOS - НЕ машинный перевод, и вообще - НЕ перевод))

 alk moderator

link 20.11.2012 16:10 
машинный перевод существует, но пока работает недостаточно хорошо.
Trados - это система, использующая память переводов, базу, где хранятся пары уже переведенных терминов.
Видно, что несмотря на то, что это разные вещи - машинный автоматический перевод и перевод с использованием памяти переводов, постепенно и все более активно первые берут на вооружение технологии вторых и таким образом развиваются.
Меня тоже очень интересует опыт форумчан по использованию различных систем работы с памятью переводов. Было бы интересно услышать об их достоинствах и недостатках от реальных пользователей.

 Val61

link 20.11.2012 16:15 
Работаю только в CAT программе (MemoQ, есличо). Т.е. 100% переводов делаю в ней. Гугль-транслейтом пользуюсь при переводах с только русского на английский разной юридическо-контрактно-аудиторской шняги типа актов проверок налоговой, экономит от 10 (как правило) до 25% (редко) времени. С английского на русский Гугль, увы, переводит вообще никак. Не обучен, видать.

Несколько лет назад убил немало времени на то, чтобы обучить Промт. Пихал ему свои словари, все ракое. Не осилил. Сдался.

Из интернет-переводчиков перепробовал все, всем им до Гугль-транслейта - как до Марса пешком.

Насчет того, что путать CAT с машинным переводом это все равно что путать зубного техника с гинекологом, уже написали.

 Enote

link 20.11.2012 16:23 
Лично я уже много лет все переводы делаю только с помощью САТ (спасибо одной заказчице, которая просто насильно посадила меня на Вордфаст).
Сейчас подсел на MemoQ.
Кстати, вчера с удивлением узнал, что к лицензии прилагается годовое обновление - тут же обновил свою 5.0.67 до 6.0.65

 ttimakina

link 20.11.2012 16:23 
Я сперва написала "кошки", но решила обойтись без сленга. Повелась на формулировку из http://ru.wikipedia.org/wiki/Trados ))

 Bramble

link 20.11.2012 16:24 
Wordfast Pro и Trados+Multiterm - использую регулярно. К обоим подключается Google MT. Также есть возможность подключения Microsoft MT, Wordlingo.
Если раньше использовала еще memoQ, то сейчас в этом смысла нет: всё взаимно конвертируется, translation memories и termbases переводятся в любой формат из любого формата.
ttimakina, Trados (DejaVu, Wordfast, memoQ, Transit, Across) - это CAT-tools ("кошки"); системы машинного перевода - названные мной плюс Promt, babelfish (if any).
Использование CAT+MT повышает производительность и экономит время. Не для всех тематик! Для художественной литературы и маркетинговых текстов - нет смысла. Для юридических, бухгалтерских, медицины - хорошо, т.к. можно запомнить термины и использовать во всём тексте однообразно.
Что еще? Традос был первым, использовала его с 2005 г., потом появились остальные. Сейчас непринципиально, чем пользоваться, хотя множество агентств по-прежнему требуют Традос.
Недостатки: не всегда находит 80%-100% совпадения (т.е., ты точно помнишь, что это уже переводил, но кошка его не видит - приходится вручную искать); раньше было такое что Традос мог слететь в любой момент, отказаться вычистить или запортить документ (у Mox много на эту тему приколов:), сейчас не знаю, вроде все стабильно, тьфу-тьфу; при переводе на русский (укр.) надо следить за спряжением падежей, т.к. в termbase обычно забивают 1 падеж (чаще родительный).
Кто еще может назвать недостатки - добавляйте.
Да, ещё горячие кнопки у всех разные, при переходе с одной кошки на другую приходится некоторое время переключаться.

 Bramble

link 20.11.2012 16:26 
Да, Wordfast Pro купила 2 года назад, он окупил себя уже за первый месяц работы (была специальная цена для СНГ - что, ИМХО, следует сделать и другим производителям). Перевожу 80% в Вордфасте, 20% в Традосе. Без них - только редактирование или внесение изменений в уже переведенный текст.

 marina007

link 20.11.2012 16:36 
Если не о КОШКАХ, то автоматический/машинный перевод существует уже давно. Есть область искусственого интеллекта, которая забавно "Natural language", это для любителей, но интересно, много узнаешь о языке.
ПРОМТ хорошо работает в узко-специализированных областях, где подключены нужные словари и ручками забиты/поправлены нужные сочетания. Видела результаты в биржевых сводках - более, чем приемлемо. Сама прогоняла русские тексты на английский для специалистов по геологии почв - были счастливы, поскольку могли в 300-500 страничном тексте понять, о чем речь, выбрать нужные страницы и начать дискуссию. Даже не хотели "ручного" перевода. Но опять же, предварительная работа была необходима.
Хотя сама машинный перевод не люблю - много предварительной работы и результат не шибко красивый.
А пользование "кнопочным" переводом типа Гугла и пр. - кажется мне странным.

 ttimakina

link 20.11.2012 16:40 
Bramble, я пользовалась только OmegaT, ибо сижу на MacOS. Не могу сказать, что в восторге. Возможно, сама программа слабовата/кривовата. Есть какие-то онлайновые средства, вот из-за них весь сыр-бор у нас с мужем и разгорелся.

 Bramble

link 20.11.2012 16:45 
Из онлайновых знаю wordfast anywhere - попробуйте, может, понравится. Мне нравится офлайновый вариант:) Worth paying for, но для начала попробуйте поюзать демонстрационную версию.

 Bramble

link 20.11.2012 16:50 
ttimakina, а из-за чего, собственно, сыр-бор? Хуже кошка не сделает, и медленнее процесс перевода не пойдёт (нужно только некоторое время потратить на освоение), а вот если в тексте 20% повторов или тексты однообразные (договора, судебные документы), то очень даже может ускорить скорость работы. И устраняет известный баг, когда, к примеру, lease переводят в одном и том же документе и как договор аренды, и как соглашение об аренде и просто как аренду:)

 Aiduza

link 20.11.2012 16:52 
На предыдущем проекте я активно пользовался Традосом где-то около двух лет, потом делал переводы на дому с его использованием, всё устраивало, программа очень полезна при переводе однотипных документов (напр. технических условий, опросных листов), только вот служба поддержки в Британии какая-то непутёвая. На новом проекте Традос не используется вообще, но здесь и однотипных документов почти нет, мы в основном переводим текущую переписку и небольшие обновления проектных документов. На данный момент я не пользуюсь Традосом уже 2 с лишним года. Надеюсь, что вспомню, как в нем работать, если понадобится (по аналогии с умением ездить на велосипеде ;-) ). Другие системы не пробовал, как-то установил пробную версию OmegaT, но при наличии Традоса не увидел смысла тратить время на ее изучение.

 Sjoe! moderator

link 20.11.2012 16:52 
Невеththuха по жисти. В которой видел я тока один некосноязыкий исходник (Executive Order by US President G.W. Bush Jr of all people), достойный занесения в "сегменты" САТ.

Но я перевел его Промтом. :))

 alk moderator

link 20.11.2012 16:59 
Bramble - поясните, пожалуйста, что есть окончание MT в перечисленных Вами приложениях. Каким образом разные Cats обмениваются базами TM? Потому что есть открытый стандарт, которому они следуют, или у каждого есть свой конвертер в открытый стандарт и обратно?
Насколько эффективно работает fuzzy match у разных Cats?
Хорошо ли они годятся для перевода технической документации, всяких спецификаций к оборудованию и тому подобной "сухой" литературы?
Как обстоит дело с сетевой/многопользовательской работой, чтобы несколько человек могли использовать/дополнять глоссарии и TM в процессе работы.

 ttimakina

link 20.11.2012 17:13 
Bramble, я сильно опасаюсь за "мусор" и порчу исходного форматирования текста. Я отлично умею это самое форматирование делать, но у заказчиков обычно всё сделано как бог на душу положит и тратить время на восстановление "как было" дико жалко времени :(
OmegaT сильно вроде бы не портила, но меня ещё очень раздражает большое количество "постороннего" и "лишнего" перед глазами. Так что для меня дискомфорт оказался больше пользы.

 lesdn

link 20.11.2012 17:23 
alk, не Bramble, но немного отвечу:
DeJa Vu и Trados могут обмениваться базами (я несколько раз экспортировал-импортировал). Насчет других, не знаю, ибо не пробовал.
Сетевая версия есть у Традоса (Trados Server) по сути с одной базой работает несколько пользователей.
Лично меня в Традосе (и других кошках) прельщает функция Concordance (поиск по базе перевода на наличие соответствий), очень сильно помогает для соблюдения единства терминологии.
В сетевой версии Традоса Concordance работает, позволяя всем подключенным пользователям писать один и тот же бред (а не его синонимы), конечно, если с помощью слова и паяльника заставить их выверять всю терминологию.

 Bultimdin

link 20.11.2012 17:33 
Trados как-то изучал, и не понравился совсем. Правда, было это давно.
Есть нормальные программы, более удобные и гораздо более простые в освоении.
Что касается промта и гугля - они нормально могут работать, если изначальный текст составлен грамотно и без ошибок, и предложения не ацки длинные. Если времени в обрез, и успеть перевести даже традосами невозможно в принципе, можно и промтом. Потом пару часов на исправления, и дело сделано. :) Но, опять же, это крайний случай.

 Enote

link 20.11.2012 17:48 
2 alk
Все известные мне программы САТ могут импортировать/экспортировать ТМ в формате ТМХ (который как раз для этого и создан).
Сетевых/многопользовательских версий полно, но они у компаний, а не у фрилансера
Эффективность работы fuzzy match зависит только от степени соответствия ТМ данному документу.
Разница между разными программи САТ одного поколения - чисто интерфейсные и идеологические моменты, они все умеют выполнять примерно те же самые функции.

 azu

link 20.11.2012 18:04 
Пользуюсь Вордфаст больше 5 лет. Удобно даже тогда, когда заранее знаешь, что совпадений не будет. Очень удобен сам механизм сегментирования. Ничего не пропустишь и удалять вручную ничего не надо. После этого с листа вообще переводить долго. С Excel тоже пользуюсь им, а вот сложно распознаваемые pdf и презентации делаю вручную, а то править форматирование потом дольше получается.

to timakina: "но меня ещё очень раздражает большое количество "постороннего" и "лишнего" перед глазами" - а это к чему относится? к delimeters? Так некоторые и непечатаемые символы отключают, вот отсюда у заказчиков и ужасное форматирование пробелами бывает.

 ttimakina

link 20.11.2012 18:39 
azu, не знаю как в других программах, в OmegaT показывается несколько фреймов, очень рассеивается внимание. Теги меня раздражают ))
Форматирование пробелами - мелочи! Есть очень много людей, которые добиваются "красоты" и "правильности" форматирования текста совершенно извращенными способами. Представления о стилях у людей нет совсем. Когда говоришь, что оглавление, список рисунков и таблиц собираются автоматически, кричат "шайтан!" и не верят ))
Самый патологический случай был - одна ученая дама главы в отчёт писала в Excel'е! Шириной текста заведовала граница столбца, каждая строка таблицы - строка текста. Страница текста = лист таблицы.

 Bramble

link 20.11.2012 18:40 
alk, MT означает программы машинного перевода (напр., google translate) - он подключается к кошкам с помощью плагина.
Базы конвертируются с помощью таких программ как Okapi в любой формат, приемлемый для кошек (tmx - самый распространенный). Есть еще termbases (не путать с TMs), они тоже конвертируются, например, из excel в txt, и подключаются к кошкам. TM содержат сегменты текста, termbases - термины (слова и словосочетания). Глоссарии, присланные заказчиком, можно конвертировать в termbases.
Крупные компании имеют сетевые ТМ, к которым подключаются переводчики и редакторы. Для этого им высылается адресная строка и пароль. Также эти компании имеют сетевые глоссарии (termbase), к которым подключаются переводчики.
Насчет техники не знаю, не беру её принципиально.
Насчет сравнения fuzzy - не знаю, все они глючные, хотя вроде мемокью понадежнее (шведы все-таки разрабатывали).

 Bramble

link 20.11.2012 18:42 
ttimakina, общее требование, как правило, тэги сохранять на своих местах. Однако если видишь в одном абзаце 28 тэгов - конечно, надо подключать здравый смысл, и загонять всех в конец строки одним щелчком мыши:)
Форматирование - это вообще не проблема переводчика, о чём неоднократно упоминал уважаемый tumanov.

Get short URL | Pages 1 2 all