DictionaryForumContacts

 Wlastas

1 2 3 4 5 all

link 13.03.2017 12:55 
Subject: Про подключение нейронных сетей к "Google translate" gen.
возможно, вы уже читали, но всёже:
Глава Google Translate Барак Туровски — о том, как сервис переходит на нейросети

 Wlastas

link 13.03.2017 12:57 
всё же*

 Casual Asker

link 13.03.2017 13:37 
Встретимся на паперти, коллеги. Боливар не выдержит всех.

 Wlastas

link 13.03.2017 13:57 
Для русского языка уже работает онлайн кстати.
И качество стало значительно лучше, особенно если выдает несколько вариантов перевода,
Главный менеджер у них - русскоговорящий, так что все крайне радужно.
Дело за малым - качественный русско-английский корпус, адаптированный под ихнюю нейронную сеть.
Думаю, скоро начнут скупать ваши TM по сходной цене ;-))

 JetiX

link 13.03.2017 14:36 
На Хабре об этом писали неделю назад: https://geektimes.ru/post/286668/
Однако переводчиков призвали не спешить выбрасываться на свалку истории: https://geektimes.ru/post/286692/

В комментах к первой статье один нехороший человек пишет:
"Жаль, что не много людей в паре русский-английский помогает там с переводом. Я всего сотню-полторы коммитов сделал в прошлом году и попал в топ 5% (гугл письма рассылал)."

Молодец, чоуж.

 Casual Asker

link 14.03.2017 6:30 
Жаль, что не много людей в паре русский-английский помогает там с переводом

Да уж, было бы странно пилить сук, на котором сидишь. Гугл буквально выдает нам лопату и предлагает самим себе копать могилу.

Я не удивлюсь, что в день Икс они просто купят все крупные бюро вместе с их базами и развернут новый платный сервис для бизнеса за копейки. Покупать стартапы за миллиарды у них деньги есть, уж наверняка найдутся деньги купить крупные бюро.

И вот в этот день можно будет смело шагнуть в окно.

 A.Rezvov

link 14.03.2017 6:41 
to Casual Asker:

Нельзя так пессимистично глядеть на мир.

 O2cat

link 14.03.2017 8:04 
Да, щас..
Нейронные сети обладают свойством расти, причем в геометрической прогрессии. Подавятся гугловцы, не говоря уже об антимонопольном законодательстве. Ближайшее будущее - машина + живой переводчик. Методу растущих пирамидальных сетей уже лет сорок, ну и фигли.. Или что-то новое придумали, пока я спал?
Чтобы машина научилась думать, надо соорудить аналог первой сигнальной системы, а это сильно другой уровень железа. А еще - функциональные модели, ассоциативная память.. Этим целые академии занимались, и все без толку. Целый язык Prolog создали, японцы на нем хотели сделать компьютеры четвертого поколения, тоже обломились. Пока компьютерные технологии развиваются по экстенсивному пути - нечего и мечтать. Текст, уважаемые господа, вещь сама по себе бесполезная, он лишь крутит педали велосипеда воображения, а воображение фиг смоделируешь. Даже если они замутили самообучающуюся хрень, что уже само по себе нобелевка, ее еще десять лет обучать придется, и еще не известно, захочет ли она заниматься переводами. Может и самосозерцанием заняться. Кто-то из кибернетчиков смоделировал закон - чтобы некая система могла смоделировать другую, она должна быть минимум на два порядка мощнее моделируемой. Поэтому, кстати, я не верю в психологов. Нейронные сети надо не моделировать, а создавать аппаратно, чего не позволяют современные технологии. Так что "если хочешь попасть внутрь, не пробуй так интенсивно" - машинный перевод текста от THE DOORS.

 A.Rezvov

link 14.03.2017 8:49 
А я лично не берусь предсказать, обломается Google или нет. Всякий расклад может случиться.

Конечно, вполне справедливо, что нейтронные сети - вещь далеко не новая. Вполне справедливо и то, что текст, в известном смысле, "вещь сама по себе бесполезная". Именно, текст, в идеальном случае, должен вызвать в мозгу переводчика некую картинку мира, которую нужно всего лишь описать на другом языке.

Однако, как мы видим, компьютер (при наличии сверхмощной базы переводов) переводит совсем на иных принципах, среди которых важное место занимает анализ частотности употребления. Если к этому добавить тонкости в виде механизма выявления контекста, то результат может приобрести (внешне, по крайней мере) вполне себе товарный вид.

Конечно, первое впечатление бывает обманчиво, но захочет ли кто разбираться и входить в тонкости?

Итак, на мой взгляд, вероятность того, что спрос на переводы в их нынешнем виде будет удовлетворятся иначе, нежели теперь, не равна нулю. И при таком сценарии, скорее всего, в большинстве случаев это действительно будет связка человек + машина. Но это не снимает возможных проблем, с которыми могут столкнуться многие нынешние работники мыши и клавиатуры.

 glomurka

link 14.03.2017 8:52 
>>Я не удивлюсь, что в день Икс...

перед днем икс будет, например, месяц игрек, когда заклятые друзья из какой-нибудь Bing Translator вольют им корпус побольше и потоксичнее, а потом раздуют скандал, что Google translate неправильно переводит.

будет, например, судья зет, настойчиво интересующийся, кто такой переводчик Гугл Трансляторов, где его печать, и кого привлекать, в случае чего, по ст. 307 УК

много еще чего будет. НИ СЫ

 O2cat

link 14.03.2017 9:05 
Да, есть такая опасность, что гуглевцы научат эти сети складывать паззлы, и они начнут выдавать связный текст, имеющий смысл. Но смысл может оказаться не тем, что подразумевался в оригинале. После пары сотен судебных исков им придется нанимать пару сотен тысяч проверяльщиков..
А еще можно усадить за клавиатуру пару миллиардов обезьян, и они за пару миллионов лет выполнят вообще все переводы, вот только кто будет выбирать нужный? )

 Wlastas

link 14.03.2017 9:08 
2 O2cat
Вы тут много чего написали, но как раз этапы "нобелевка" и "а это сильно другой уровень железа" уже пройдены.
Результатом которой стало 100% распознавание машинных номеров/морд лиц (на фотках, с камер и т.д) и близкое к 100% распознавание речи(с аудио потока, без доп. адаптации/обучения нем) - привет большой брат и тотальная прослушка.
По части перевода сейчас реально проблема только в качественном корпусе по каждой языковой паре, который, к сожалению нельзя собрать из уже доступных источников.
Так как это должен быть "правильный подстрочник" с четким расположением слов, что не наблюдается в вольных переводах худ- лита например, а грамотные переводчики не заинтересованы в создании подобной базы и не помогают её наполнению своими наработками/помощью.

 Casual Asker

link 14.03.2017 9:11 
>НИ СЫ

Стараюсь.

A.Rezvov - очень хорошо сказано.

Возможно, все не будет так однозначно - "встали и вышли". Но все же условия изменятся сильно, и конкуренция обострится, и спрос на людей упадет. Просто неприятно думать об этом, когда уже за тридцать.

Ну сколько можно врать? Нет никакого 100% распознавания машинных номеров и лиц, и нет никакого 100% распознавания речи. Нет даже 100% работы тех самых камер на улицах, из них треть максимум работает, остальные для устрашения стоят. Нет ни одной программы, которая работала бы без глюков. И не будет никогда.

 Tiny Tony

link 14.03.2017 9:31 
Думаю, толковый человек без работы не останется, даже если машина прекрасно справится с любым нехудожественным переводом. Пусть эта работа отличается от нынешней, но она точно будет, наверняка в достаточном количестве и достаточно квалифицированная. Вероятно даже, что её станет больше и она станет интереснее и разнообразнее.

Вот например, с изобретением книгопечатания переписчики вроде бы лишились работы, но сколько новых сфер деятельности появилось. С приходом компьютеров и интернетов работы стало только больше, а не меньше, как предполагали некоторые.

Мне кажется, такое развитие технологий должно воодушевлять, а не пугать. Это ведь уже сейчас практически осуществлённая мечта фантастов! Ну и в крайнем случае, если завтра внезапно изобретут универсальный идеальный переводчик, который осчастливит человечество, готова ради такого дела отойти в сторону и не мешать прогрессу.

 A.Rezvov

link 14.03.2017 9:36 
to Casual Asker:

Поделюсь личным опытом: мне дважды пришлось столкнуться с тем, что я вдруг оказался человеком "без профессии": первый раз - в начале девяностых прошлого века, второй раз - в середине нулевых нынешнего.

И личный опыт, и опыт тех, кто жил задолго до нас с Вами, говорят об одном: главное - не унывать. Чего желаю и себе, и всем участникам форума.

Кстати, из интервью Барака Бобровски совершенно понятно, что перед его подразделением задача "монетизации" созданных наработок пока вообще не ставится! Поэтому у "живых" переводчиков есть определенный запас времени. Каков он - предсказать невозможно, но даже при наихудшем для нынешних кадров раскладе это несколько лет. Есть время подготовиться.

 Wlastas

link 14.03.2017 9:40 
Ага все это работает только в кино :-)
Facebook научился распознавать лица в толпе с точностью 97,25 %

В любом случае, настоящие классные переводчики без работы не останутся, но вот заказы на "ширпотреб" могут полностью перекочевать к "учителям русского языка в отставке", которые будут просто подправлять машинный перевод. И это будет устраивать 90 % заказчиков.

Пока что этот проект оформлен только в виде исследовательской работы.

Сколько их было...

 Translucid Mushroom

link 14.03.2017 9:47 
к слову, а есть программа, которая умеет слушать речь в видео и ее на том же языке в ворд печатать?

 Wlastas

link 14.03.2017 10:06 
*к слову, а есть программа...*
Самый простой вариант - приватно разместить ролик на youtube и дождаться, когда робот ему сделает субтитры. Скорость обработки зависит от многих факторов - часов за 6 точно переведут. Требуется ручная проверка результата.

Более трудозатратно, но и более точно и сразу же с проверкой с помощью сторонней программы:

На любом гуглофоне есть сервис распознавания речи - ему последовательно скармливаете через динамик, к которому приближен телефон, фразы из видео.

После распознавания в программе появляется выпадающий список, из которого выбираем правильный вариант (обычно 1из5, если речь четкая, то бывает распознает как 1/1). Далее Скармливаете следующую фразу и т.д. В ворде это делать не удобно, так как нет визуального контроля над звуковой дорожкой. Готовый текст вставляете в ворд

 A.Rezvov

link 14.03.2017 10:08 
ПОПРАВКА (см. 14.03.2017 12:36):
"из интервью Барака БобТуровски".

 натрикс

link 14.03.2017 10:21 
унывать не надо, но надо любой бизнес стараться диверсифицировать.
про то, что нельзя хранить все яйца в одной корзине, не вчера и не дурак придумал.

 Wlastas

link 14.03.2017 10:29 
*задача "монетизации" не стоит ..* ага, только они уже давно отменили безвозмездное и неограниченное использование их сервиса и взимают "$20 per million characters" за его использование.
Пока, правда, можно использовать сервис на халяву, эмулируя работу реального пользователя и делаю 1-2 запроса в 5 сек, но это уже "хак" и неизвестно, сколько он проработает.
Вот про 100% распознавание речи неплохо:
http://www.mirror.co.uk/news/weird-news/parents-panic-amazons-alexa-starts-9540023

(Parents panic as Amazon's Alexa starts reciting crude porn phrases to toddler who asked for nursery rhyme)

 Tante B

link 14.03.2017 10:47 
Wlastas 14.03.2017 13:29
кстати, в последнее время стала замечать, что они подозревают, будто я робот :)
никогда такого не было --- и вот опять! (с)

 Lonely Knight

link 14.03.2017 10:58 
Да понятно, что качество машинного перевода со временем будет только лучше, по тем или иным причинам (нейронные сети, новые базы...)
И понятно, что человек останется только там, где предъявляются повышенные требования к качеству - литературные и окололитературные тексты, реклама там всякая, юридические документы.
А уж в технической области, деловой переписке и ежедневном общении в выборе "красота" (=вылизанность) и скорость/цена всегда победит последнее. И это нормально, че. Главное - чтобы было понятно.
Да понятное дело, что машины должны вытеснить ручной труд. Еще в 19 веке все знали, что вот где-где, а в строительстве так точно ручного труда не останется:

Get short URL | Pages 1 2 3 4 5 all