Subject: ОФФ: интересное про машинный перевод gen. Наткнулся на весьма познавательную статью по истории и принципу работы машиинных переводчиков.http://vas3k.ru/blog/machine_translation/ |
Тысячу раз спасибо за статью! Восполняет пробелы) |
Отличная статья. К сожалению, по-прежнему для максимально качественного обучения сетей нужно огромное количество параллельных текстов(привязанных к опред. тематике) с ручной обработкой исходника носителями языка (разбивка на смысловые блоки и их упрощенное изложение) + подстрочный перевод(без изысков) . Существующие базы параллельных текстов (на основе худ. лита/новостей/субтитров к фильмам и т.д.) подходят для этих целей только с большой натяжкой. |
Автор статьи оперирует такими умными словами и сложными понятиями, но так и не запомнил, что правильно будет "килограММОВ"!!! Чего? КилограММОВ!!! Слово "килограмм" мужского рода! Малограмотные просто бесят. |
|
link 5.02.2018 9:17 |
Там же написано - "дословно" в заголовке |
|
link 5.02.2018 9:54 |
"Теперь мне даже странно вспомнить, как сердило меня на первых порах нынешнее словосочетание: сто грамм. — Не сто грамм, а сто граммов! - с негодованием выкрикивал я. Но мало-помалу привык, обтерпелся, и теперь эта новая форма кажется мне совершенно нормальной." Корней Чуковский |
|
link 5.02.2018 10:11 |
В статье приводится такой пример: эти типы стали есть на складе --> these types of steel are in stock а по-моему можно перевести --> these types began to eat at the warehouse |
"Очень круто работает на коротких повседневных фразах типа «пойдем на обед» или «буду ждать внизу». Гугл знает разговорный английский лучше меня :(" То есть эту нейронную сеть можно использовать в качестве по сути словаря разговорных выражений. Это, конечно, здорово, но вот только я попробовал эти выражения в Google-Переводчик ввести (наговорить), получилось: пойдем на обед – let's go to dinner Попробовал от себя: Айс? |
|
link 5.02.2018 11:25 |
Оттуда же: Айс? - Ice? |
bredogenerator, я поняла именно как these types began to eat at the warehouse. А про сталь дошло только когда увидела перевод :-) |
Этому человеку нелься писать статьи **в Академию Наук СССР** **По классике в СССР изобретение признали «ненужным», Троянский умер от стенокардии, 20 лет пытаясь её доработать** **кучка стран сорок лет подряд пытались шпионить друг за другом** **два других советских ученых** |
Часы на изучение иностранных языков в школах увеличиваются за счет уменьшения часов русск. и литературы: такое вот Минобразования попалось... Поэтому количество периводчегов в стране растет не по дням, а по урезанным часам. |
В гимназиях и высших начальных училищах моего уездного городка, расположенного в трёх верстах от Москвы, на изучение английского языка отводится 90 минут в неделю. Изучают лексику. Грамматику изучают по примерам, правил не заучивают. В мою пору были классы с французским и немецким. Ныне учат только английский язык. |
|
link 5.02.2018 14:29 |
Интересная статья. Хотел бы я разбираться в нейросетях, компьютерном обучении и так далее. |
|
link 5.02.2018 14:50 |
А зачем? Все равно через 5 лет про это забудут и в моде будет что-то другое. |
|
link 5.02.2018 14:56 |
А зачем? Все равно через 5 лет про это забудут и в моде будет что-то другое. ============================= Не уверен, что забудут. Это уже приносит большие деньги, значит, эта отрасль будет развиваться. Не удивлюсь, если через 5 лет нейросети будут переводить тексты не хуже людей. Судя по истории с игрой Го, предсказать скорость развития ИИ становится трудно. |
"Автор статьи ... так и не запомнил, что правильно будет "килограММОВ"!!! Чего? КилограММОВ!!! Слово "килограмм" мужского рода! Малограмотные просто бесят." Зачем же так резко? Да и вопрос не такой прямолинейный. Например, историческая справка по нему с грамоты.ру: ... любопытно проследить историю форм грамм – граммов, килограмм – килограммов ... хотя бы за последние полвека. До сих пор распространено мнение, что формы грамм, килограмм в родительном падеже мн. числа ошибочны. Между тем на их допустимость словари указывали еще в 1950-е. |
|
link 5.02.2018 15:05 |
А помните Тетрис и кубик Рубика? Бешеные деньги приносили в свое время. Вот в Москве сегодня, например, несмотря на все достижения цифровизации, блокчейнов, спиннеров и блоггеров-вейперов главные люди - это дворник с лопатой и тракторист (с трактором). Потому что зимой внезапно выпал снег. Баловство вся эта ваша кибернетика. |
Да, тут надо бы копнуть глубоко и порыться в своих детских обидах (и даже - родовых травмах! :), чтобы понять, почему при взгляде на фразу "эти типы стали есть на складе" как первое значение приходит именно определенное :) А вот какое - у каждого своё (ли)? Или нет? Интересно, есть ли люди, у которых первая ассоциация - "сталь", а не некие "типы", которые "стали есть"? :) Правда, насчет "типов стали" тоже сообразил почти сразу, как прочитал в статье, что там можно интерпретировать четыре значения. Но вот другие два - пока не врубаюсь. Без добавления пунктуации не вижу. Может, кто-то видит глубже? :) |
- нельзя эти типы стали есть на складе - а какие/где можно? |
У Гугла, обученного, если верить автору статьи, нейросетями, первая ассоциация именно "сталь"... Он сам это вывел, анализируя корпус текстов? Значит, такое значение - в большинстве? |
*** Может, кто-то видит глубже?*** там(на сайте со статьёй) к абзацу про сталь есть комменты(скрытые), в которых расписаны все варианты. |
|
link 6.02.2018 7:16 |
>>Интересно, есть ли люди, у которых первая ассоциация - "сталь", а не некие "типы", которые "стали есть"?>> Есть. Хотя правильно: марки стали, виды стали, стали. |
|
link 29.03.2018 19:10 |
|
link 29.03.2018 20:48 |
пойдут в менеджеры (по клинингу например) |
авотфиг. мне уже прямо здесь (на МТ) прямо сейчас контекстная реклама робот-пылесос предлагает. ну и кому нужны эти ваши менеджеры по клинингу при наличии робота-пылесоса? он хоть и гудит, но работает без выходных и в отпуск не просится (а также не ходит в рабочее время к стоматологу, на больничный, в декрет, подставить нужное) |
Re: робот-пылесос Он обсасывает только полы. А вот, скажем, вытереть пыль с бюста Аляксандра Дюмы он, увы, не в состоянии... Это. кстати, типичный парадокс автоматизации: то, что мы, человеки, понимаем как определенный род работы, на практике состоит из непохожих друг на друга операций, которые поддаются автоматизации в совершенно разной степени... |
для Дюмы скоро будет что-нибудь летучее с этим, который так неприлично называется... с пипидастром, вот! |
|
link 29.03.2018 21:54 |
на самом деле на горизонте маячит не вымещение людей роботами - а груда металла и пластмассы ибо кто-то всех этих роботов должен будет программировать ... а в программистах народ задерживается так же как и во всех остальных профессиях - 10-20% от отучившихся пять лет в вузе по специальности ... так что перспективы тут в разы хуже чем в машинном переводе |
* вытереть пыль с бюста Аляксандра Дюмы * У кого это _дома_ бюст Дюма стоит? |
на полочке стоит Дюма я пыль сотру с него сама такого ценного Дюму я не доверю никому |
дрон с набором сменных пипидастров для вытирания пыли с бюстов. -ужас- |
Вроде глобально роботы - на пользу: население стареет, а роботы их накормят-напоят, обогреют и утку принесут. Но реально напряг, как переквалифицировать тех, чьи профессии исчезнут во вполне трудоспособном возрасте, да и просто молодежь, только выходящую на рынок труда. Все настолько ново, что никто не может дать дельный совет, где работать им тогда, чем заниматься. Выучишься на майнера криптовалюты, а оно через 2 года никому не нужно. Можно, конечно, посоветовать изучать то, к чему лежит душа. Но это - уже сейчас гигантская проблема. Люди тратят деньги и годы жизни на обучение тому, что никому не нужно и денег им не принесет. И живет человек с нереализованной мечтой и, чтобы служба совсем медом не казалась, колоссальным долгом банку. |
на майнера криптовалюты нужно учиться? - фигасе. кстати, наши местные махровые криптовалютчики что-то притихли. |
|
link 29.03.2018 23:05 |
у молодежи душа лежит к халяве. и учиться недолго, и через 2 года точно не устареет. |
Local, Я с Вами во многом согласен, за исключением одного: роботы скорее научатся нейрохирургии, чем подносу уток. Особенно с учетом того, что поднос уток необходим и в домашних условиях. Мне кажется, что рано или поздно (и не везде одновременно) возникнет новый общественный договор: какая-то комбинация прогрессивного налогообложения и всеобщего базового дохода. Сейчас это выглядит как фантастика, но в каком-нить 1870 году точно так же выглядела бы, например, комбинация восьмичасового рабочего дня и современного пенсионного обеспечения... |
* на полочке стоит Дюма я пыль сотру с него сама такого ценного Дюму я не доверю никому * А если робот-пылесос |
"эти типы стали есть на складе" Штрилиц увидел голубые ели. Пригляделся - они не только ели, но и пили |
Rus_Land, > Интересно, есть ли люди, у которых первая ассоциация - "сталь", а не некие "типы", Я ОЧЕНЬ сильно сомневаюсь... Типы, у которых есть устойчивые ассоциации со сталью (прасьтитя за коломбурЪ), обычно оперируют понятием "марка стали". На складах лежит сталь определенных марок. Есть понятие "виды стали", но оно родовое, а не специфическое -- легированные стали, низкоуглеродистые стали, высокоуглеродистые стали и т.п. Даже справочники по маркам стали называются "марочники". |
NC1, да, я тоже так подозреваю, хотя вверх по ветке были и другие мнения. Впрочем, вряд ли кто-то проводил соответствующие исследования :) Ну, раз специалисты-"сталевары" стопудово отпадают, остаётся эфемерная "надежда" лишь на неких "стальных чайников", которые настолько высококультурны и утонченны, что слово "типы" для обозначения человеческих существ в их рафинированном мозгу ну никак не умещается :) |
> Интересно, есть ли люди, у которых первая ассоциация - "сталь", а не некие "типы", > которые "стали есть"? :) У меня был план для удобства заменить "типы" на "кексы" а потом разбирать предложение заново, уж очень про сталь неромантично :) |
>> Мне кажется, что рано или поздно (и не везде одновременно) возникнет новый общественный договор: какая-то комбинация прогрессивного налогообложения и всеобщего базового дохода. Если базовый доход, то есть деньги в подарок, то это по всем прикидкам - коммунизм, вроде раньше об этом мечталось. С другой стороны, если робот заменяет человека, то человеку станут платить меньше, чем он получал, иначе зачем заменять. То есть как бы работать не нужно вообше, но вот получать придется меньше. Как-то странно получается: вроде прогресс идет, а благ человеку меньше. Или что-то в этих расчетах хромает, хорошо бы. |