DictionaryForumContacts

 nephew

link 17.01.2009 16:06 
Subject: Cognitive Translator
http://www.novayagazeta.ru/data/2009/003/13.html

 mahavishnu

link 17.01.2009 20:28 
Жаль, не могу открыть: мой Макафи говори, что сайт подозрительный, и не пускает меня в него. Успеваю увидеть только слово "тарабарский". И всё.

 nephew

link 17.01.2009 20:36 
надо бы сообщить рупору российской оппозиции - "Новой газете", что Макафи считает ее подозрительной

 Translucid Mushroom

link 22.01.2009 15:16 
Перевод с английского на тарабарский

Обзор электронных переводчиков

В декабре компания Cognitive Technologies предъявила публике окончательный вариант своего электронного переводчика нового поколения. Cognitive Translator создавался небольшой группой специалистов как опытный продукт, но алгоритмы, положенные в его основу, могут иметь большое значение для будущего этой области компьютерных технологий. Ведь прогресс в области электронного перевода уже не меньше десятка лет топчется на месте…

Проблема машинного перевода появилась одной из первых еще на заре компьютерной эры и первоначально казалась разрешимой с полпинка, лишь бы компьютеры соответствовали. Замечательный инженер и ученый Анатолий Иванович Китов, один из главных борцов за восстановление в правах «реакционной лженауки» кибернетики в СССР, в 1956 году писал: «После того как составлен машинный словарь и разработана система четких правил для работы машины, составление самой программы машинного перевода, несмотря на ее чрезвычайную громоздкость (она содержит несколько тысяч команд), не представляет принципиальных трудностей».

«Несколько тысяч команд», «не представляет трудностей»? Как же. Современные компьютеры выполняют миллиарды команд в секунду, но качество автоматического перевода практически осталось на том же уровне, что и десятилетия назад.

Базовый уровень, при котором программа может осуществлять элементарный лингвистический разбор предложения и находить соответствия в словарях, достигнут еще к началу 1990-х, все остальные усовершенствования заключались в том, чтобы вручную обучить машину разрешать неоднозначности и как можно большему количеству исключений из правил. А любая живая речь сплошь и состоит из таких исключений и неоднозначностей. Классическим примером, который в свое время кочевал по страницам докладов ученых-лингвистов, может послужить фраза «идея яростно спала». Конечно, можно придумать контекст, в котором эта фраза будет что-то означать (предлагалось, например, интерпретировать слово «идея» как имя собственное, а «яростно» при этом — как метафору, что-то вроде синонима «беспокойно»), но в общем случае это абсолютно бессмысленное сочетание. И наоборот, такое формально неграмотное сочетание слов, как «потуши свет» (т.к. свет повсеместно электрический, правильно его «выключать»), является вполне нормативным для русского языка выражением. Про чисто сленговые высказывания — вообще умолчим. Поэтому в общем случае для правильного перевода надо сначала знать, о чем текст, то есть понимать его смысл.

А вот с этим у компьютеров традиционно плохо. И именно на пороге понимания заканчиваются все достижения систем машинного перевода, ведь язык — даже не шахматы, где число практически значимых вариантов выбора хоть и очень велико, но обозримо. Языковое разнообразие бесконечно даже в случае, если ограничиться только рамками какой-то конкретной тематики. Ну да, компьютерная память подешевела радикально, но ясно, что все мыслимые варианты перевода в машину руками не введешь, даже если посадить за клавиатуры тысячу программистов на пару десятков лет. И потом еще надо будет повторить то же самое для каждой пары языков, каковых даже только самых употребляемых в мире — десятки. И для принципиального прорыва ничего не остается, кроме как учить машину понимать текст.

Вот в такой обстановке в компании Cognitive Technologies и попытались создать переводчик нового поколения. Об этой компании, занимающейся разработками и исследованиями в области искусственного интеллекта, мы уже недавно упоминали в связи с автоматизированной системой анализа текстов, умеющей разоблачать плагиаторов (см. «Свободное пространство» №41 от 24.10.2008).Переводчик родился как побочный продукт, в процессе разработки вот этого самого анализатора текстов, обеспечивающего «понимание», которого компьютерам так не хватает, для самых различных целей.

Работает это примерно таким образом. Предположим, у вас имеется две фразы, содержащие одно и то же слово, но в разных значениях: «на стене висел лук и колчан со стрелами» и «на стене висел лук, чеснок и какие-то коренья». Анализатор заранее, еще в процессе обучения, выстраивает статистические связи между словом «лук» и теми словами, которые наиболее часто встречаются рядом, и при этом обнаруживает, что одни сочетания («лук+чеснок») встречаются в одном окружении, другие («лук+стрела») — в другом. Для того чтобы правильно перевести фразу, осталось только выстроить соответствия таких установленных статистических связей в одном языке и в другом. Причем алгоритм, будучи отработан однажды, легко распространяется на любые пары языков.

Cognitive Translator доступен бесплатно через сайт компании (cognitive.ru), ссылку на него можно найти в разделе «Научные исследования». Я попробовал сравнить результаты перевода разными электронными переводчиками одних и тех же фраз, взяв для примера цитаты из сообщений Associated Press. Несмотря на несоизмеримо меньшее количество ручного труда, вложенное в Cognitive Translator (пока это опытный продукт), в большинстве случаев он выдает на удивление адекватные результаты, по крайней мере, не хуже, чем у таких заслуженных игроков рынка, как ПРОМТ с ее онлайновым переводчиком translate.ru.

Но в некоторых специфических случаях Cognitive Translator, увы, оказывается чересчур умным: английскую фразу «Google has added a magazine rack to its Internet search engine» (адекватный по смыслу перевод звучал бы примерно как «Google добавил к своей поисковой машине в Интернете возможность поиска по журналам») translate.ru переводит близко к буквальному переводу: «Google добавил газетницу к своей интернет-поисковой машине», а вот Cognitive Translator облажался: «Google добавил держателя кассеты к его двигателю исследования Интернета».

При этом имеющаяся у меня коммерческая версия ПРОМТ 8.0 со всеми своими базами выступила в данном случае едва ли не хуже Cognitive Translator, более верно переведя термины, но полностью лишив фразу смысла: «Google добавил газетницу к ее интернет-поисковой машине». Так что однозначно решить, кто лучше, а кто хуже, не получается, да и, вероятно, это не требуется: разработчики уверяют, что у Cognitive Translator все еще впереди.

А вообще современные электронные переводчики удобны лишь в двух случаях: как средство получения подстрочного перевода, с тем чтобы быстро уловить общий смысл текста (хотя совсем не обращаться к словарям, как видите, не получается), и еще как средство для того, чтобы при необходимости суметь создать короткий текст (деловое или приветственное письмо) на иностранном языке самостоятельно. В последнем случае без капитальной правки текста обойтись также невозможно, но при минимальном знании языка на школьном уровне это все-таки значительно проще, чем пытаться составить его с нуля. Ну, а если вы хотите быстро получить настоящий литературный перевод, то кроме живого переводчика, ничего лучше пока не придумаешь.

Юрий Ревич
обозреватель «Новой»

16.01.2009

 mahavishnu

link 22.01.2009 16:56 
Женя, спасибо за информацию. Теперь можно и прочитать о тарабарском переводе.

nephew, я сообщил им, но меры не приняты. Денег, наверное, на сертификат жалко.

 

You need to be logged in to post in the forum