Subject: OFF. Нейронные сети и конец переводчикам
|
дааа, моделям gpt, чтоб быть более человекоподобными, не хватает аналога долговременной памяти, чтоб чётко помнить предыдущие решения и быть последовательными, кмк) тоже были мысли об этом, но не в таком структурированном виде The model is able to reference up to approximately 3000 words from the current conversation класс, благодарю за накидку идей! гляну видос и буду экспериментировать)) ♥ |
|
link 20.02.2023 19:26 |
Google Translate более-менее переводит "Kannst ты please mi dire, what день is heute?", если поставить "Detect language": "Пожалуйста, милая, какой сегодня день?" |
Да, Вы правы, Гугле ближе всех. А если еще кликнуть на корявый перевод, то случится чудо: Появится совершенно правильный подстрочник на немецком, но перевод на русский еще хромает. Так что, пока счёт 1:0,5 в пользу GPT. Но посмотрим, что будет дальше. |
|
link 20.02.2023 19:52 |
Напоминает битву Каспарова с компьютером. Помним, чем она закончилась |
а мне это I am напомнило |
Не хочу показаться луддитом, но, поэкспериментировав, я не увидел, чтобы ChatGPT мог думать, как это делает человек. Для «человеческого» перевода, мне кажется, машине нужна вторая сигнальная система по Павлову, т. е., абстрактно-логическое мышление, способность к анализу и синтезу; без неё машина не видит за деревьями леса. В то же время для перевода каких-то видов текстов, как и для решения второстепенных, служебных задач при переводе, ChatGPT – хороший инструмент. |
= без неё машина не видит за деревьями леса= Иными словами, чтобы получить хороший машинный перевод, нужно иметь хороший машинный оригинал. |
Думаю, не только это, но для каких-то текстов этого достаточно, хотя и здесь потребуется редактор (MTPE). Многое зависит от требований заказчика перевода. Если нужен перевод для деловых целей, то нужно творчество, а творчество, как писал Н.К. Чуковский, не может быть механическим. С одной стороны МП удешевляет перевод и ставит под вопрос жизнеспособность профессии переводчика, с другой стороны при капитализме главная цель – преумножение прибыли, и чтобы что-то втюхать (покупают люди, а не машины), человека нужно умаслить, убедить, т. е., текст должен «продавать». Продукт МП — это «нижний передел»; как правило, его отличают неучёт контекста и обезличенность (он не откалиброван под конкретный экстралингвистический макроконтекст и конкретную ЦА), вторичность/неоригинальность, ходульность, внутренняя несвязность/рыхлость, штампы, клише и нередко неправильно расставленные акценты. Поэтому такой перевод не цепляет читателя, он не убедителен, « не продаёт » . Хороший перевод, когда требуется передать смысл и посыл (у Чуковского – дать насыщенное человеческим чувством и человеческим смыслом изображение действительности ), нередко должен быть улучшенной версией оригинала. Где машине взять для этого экстралингвистические знания? Машина должна научиться «улучшать» перевод, а для этого нужны абстрактно-логическое мышление, фантазия, fact checking + навыки общения с заказчиком для уточнений спорных мест и ошибок/неточностей. |
= Продукт МП — это «нижний передел»; как правило, его отличают неучёт контекста. = Забавно, что вы не понимаете специфику нейронных сетей. Они именно, что заточены под контекст. Другой вопрос как этот контекст выявляется. Вообще-то, нейронные сети ентот самый контекст могут понимать лучше, чем очень многие люди. |
= Ч тобы получить хороший машинный перевод, нужно иметь хороший машинный оригинал. = Натренируют. |
Pokki (21.02.2023 17:04), 1. Что Вы понимаете под словом «контекст»? 2. Расскажите, пожалуйста, своими словами про специфику нейронных сетей, в том числе в разрезе выявления и учёта контекста при переводе. 3. Приведите, пожалуйста, несколько (достаточно 3—4) ёмких примеров понимания и учëта контекста нейронными сетями при переводе (желательно в парах Ru-En и En-Ru). 4. Приведите, пожалуйста, ссылки на научные статьи или авторитетные источники, подтверждающие на основе опытных данных/статистики, что нейронные сети могут понимать контекст лучше, чем очень многие люди. |
|
link 23.02.2023 7:08 |
Я думаю, нейросеть легко справится с ответами на эти вопросы :-)) |
Нет, не конец, и вот почему: Google still translates the sentence “He was a nurse” into Russian as “Он был медсестрой,” for instance. To those readers here who do not speak Russian, the word “медсестра” literally translates as “a medical sister.” Since historically most of nurses were females, this has apparently significantly affected Google’s training datasets for the Russian language. The word “медбрат” (“medical brother”) came into use only much later towards the end of the 20 th century to refer to a male medical assistant. Even now because of female workers dominating this medical specialization, the word “медсестра” is used roughly 21 times more frequently in Russian publications, thus solidifying gender bias in training data. Political bias not infrequently finds its way into machine translation algorithms too through flawed training corpora used in natural language processing solutions. In late 2020, it was reported that Google started translating the phrase “Thank you, Mr. President” from English to Russian as "Thank you, Vladimir Vladimirovich.” Also interesting to note that some time earlier Google was translating the phrase “Russian Federation” as “Mordor”, the fictional evil land in The Lord of the Rings ; and “Russians” to “occupiers.” |
|
link 23.02.2023 8:59 |
He was a nurse -- забейте в DeepL -- вы будете (не)приятно удивлены Мне тоже неприятно, что нейросети медленно, но верно, отнимают у нас работу, но вынужден признать, что на некоторых пассажах, я, переводчик с 40-летним стажем, учусь у DeepL. И редактировать DeepL по-любому легче, чем перевод, выполненный начинающим (и даже продолжающим) переводчиком, не знающим про DeepL |
Технологии, лежащий в основе автоматических переводчиков, типа Гугл-перевод, скорее всего очень давно не обновлялись. То есть, если говорить простым языком, это старье. Там с контекстом действительно так себе. Не стоит делать выводы о нейронных сетях по сервиса машинного перевода. Просто вы ещё, наверное, не видели, какие картинки создает Midjourney. Хотя и у Midjourney есть проблемы с контекстом - не может нарисовать правильное количество пальцев. |
|
link 23.02.2023 11:43 |
Вопрос не в натренированности и корпусности. Вопрос в том, что (с текущей скоростью развития процесса) еще лет пять (максимум 8) и будет нормальный получеловеческий перевод через AI. Процентов на девяносто именно получеловеческий перевод людям и нужен. PS: чуковские, набоковы, райт-ковалевы и прочие могут спать спокойно. PPS: большинство переводчиков (и парапереводчиков) даже конь-текст не учитывают. Переводят просто гуглом. |
wise crocodile (23.02.2023 10:08) Действительно, к чему утруждать себя, когда есть нейросеть?) «Позабыты хлопоты, Остановлен бег. Вкалывают роботы, Счастлив человек!» |
Pokki (23.02.2023 13:57), Расскажите, пожалуйста, чем технологии перевода с помощью нейросети качественно отличаются от технологий автоматических переводчиков типа Гугл-перевод? Благодаря чему первые понимают и учитывают контекст лучше чем вторые? |
Себастьян Перейра, торговец черным деревом (23.02.2023 14:43), 1. Если вопрос не в натренированности и корпусности, то в чëм? Объясните, пожалуйста, на пальцах, за счёт чего развивается и будет развиваться процесс? 2. На чем основан прогноз 5—8 лет? Если есть ссылки на авторитетные источники, приведите, пожалуйста. 3. Что Вы понимаете под «получеловеческий перевод»? Откуда соотношение 90/10? Конкретизируйте, пожалуйста, каких заказчиков (90%) Вы подразумеваете под людьми, которым нужен получеловеческий перевод? 4. Откуда информация, что большинство переводчиков (и парапереводчиков) даже не учитывают контекст и переводят просто Гуглом? Дайте, пожалуйста, ссылку на статью/исследование, в которых приводится статистика. |
= Чем технологии перевода с помощью нейросети качественно отличаются от технологий автоматических переводчиков типа Гугл-перевод? Благодаря чему первые понимают и учитывают контекст лучше чем вторые?= Не знаю, я потребитель товара нейронных сетей, а не инженер, разрабатывающий их. Вам доступна та же информация, что и мне. = Откуда информация, что большинство переводчиков (и парапереводчиков) даже не учитывают контекст и переводят просто Гуглом? = Если вы сами заказывали перевод и общались с теми, кто это делает, то знали бы какого рода переводы предлагают люди. И, кстати, почему вы всё время просите других людей дать вам ссылки на статьи, работы, исследования и авторитетные источники? Вы хотите на халяву всё это получить? Я могу лишь с вами поделиться своим мнением и впечатлениями. Собственно говоря, я это и делаю. Корпусность в нынешние времена ограничена интернетом, который содержит колоссальный объем информации. Если у вас есть выбор искать переводчика и платить ему деньги или воспользоваться услугами ИИ (которые, скорее всего, будут бесплатны), то вы наверняка выберете бесплатный вариант, пусть в переводе будут огрехи, которых вы просто не заметите. |
= Не знаю, я потребитель товара нейронных сетей, а не инженер, разрабатывающий их. Вам доступна та же информация, что и мне. = Вы написали, что, благодаря продвинутым технологиям, нейросети лучше учитывают контекст при переводе, чем устаревшие в этом плане переводчики типа Гугл-перевод. Я живо интересуюсь этой темой, поэтому хотел, чтобы Вы разъяснили, почему Вы так считаете; почему на основе доступной информации Вы пришли к этому выводу; от чего Вы отталкиваетесь. = Откуда информация, что большинство переводчиков (и парапереводчиков ) даже не учитывают контекст и переводят просто Гуглом? = = = Если вы сами заказывали перевод и общались с теми, кто это делает, то знали бы какого рода переводы предлагают люди. = = То есть, это Ваш личный опыт и личный опыт Себастьяна? Я выполняю переводы, заказываю переводы и общаюсь с переводчиками на протяжении последних 14 лет. Не согласен, что большинство мне знакомых переводчиков не учитывает контекст — они бы давно лишились работы (в этих джунглях простые законы). = И, кстати, почему вы всё время просите других людей дать вам ссылки на статьи, работы, исследования и авторитетные источники? = Мне кажется естественным проверять фактический материал, цифры. Эта информация лучше всего характеризует состояние дел в той или иной сфере. Вы ведь не верите всему на слово, Pokki ? = Вы хотите на халяву всё это получить? = Что значит "получить на халяву"? Если статья/работа есть в свободном доступе в интернете, то дайте, пожалуйста, ссылку на ресурс. Если же работы нет в свободном доступе, укажите выходные данные. = Я могу лишь с вами поделиться своим мнением и впечатлениями. = Спасибо. Я понимаю и просто прошу пояснений, почему Вы считаете так, а не иначе, когда мне что-либо не ясно или же, когда мне кажется, что я в чем-то не согласен. = Если у вас есть выбор искать переводчика и платить ему деньги или воспользоваться услугами ИИ (которые, скорее всего, будут бесплатны), то вы наверняка выберете бесплатный вариант, пусть в переводе будут огрехи, которых вы просто не заметите. = В моем случае всё зависит, прежде всего, от следующих факторов: 1. моих требований к переводу как заказчика (для каких целей этот текст мне нужен; какие последствия могут быть при некачественном переводе), 2. бюджета, 3. сроков, 4. требований к конфиденциальности, 5. оцениваемых трудозатрат на редактирование после МП/нейросети (стоит ли овчинка выделки?). |