DictionaryForumContacts

 rakhma

link 18.06.2015 8:41 
Subject: Помогите найти программу, позволяющую распознавать текст из видео for.pol.
Есть несколько файлов интервью в формате mov. Клиент просит перепечатать текст из этих файлов. Язык русский.

 Mast_r

link 18.06.2015 8:45 
Таких программ нет

 Supa Traslata

link 18.06.2015 8:47 

 rakhma

link 18.06.2015 8:51 
не может такого быть

 Lars Kron

link 18.06.2015 8:57 
Если на ютьюбе есть встроенная утилита распознавания речи, то, возможно, и программа такая существует. Главное, что есть технология.

 Aiduza

link 18.06.2015 8:57 
если совсем отчаялись, то вот вам метод "через заднее крыльцо":

Создайте новое сообщение на смартфоне (с операционной системой Android, iOS...). Поднесите смартфон к динамику компьютера и нажмите на клавиатуре кнопочку с изображением микрофона. Убедитесь, что выбрали раскладку клавиатуры, соответствующую языку видеоролика. Удачи. :)

 Armagedo

link 18.06.2015 8:57 
Чо значит "ПЕРЕПЕЧАТАТЬ текст из этих файлов"?

Там субтитры есть что-ле?
https://www.google.com.ua/search?sourceid=chrome-psyapi2&ion=1&espv=2&ie=UTF-8&q=extract subtitles from mov file&oq=subtitles from mov &aqs=chrome.3.69i57j0l3.14190j0j7

 Tante B

link 18.06.2015 8:58 
да вон уже очередной раз заодно и переводчиков отменили:
http://speechpad.ru/

 wise crocodile

link 18.06.2015 9:00 
Программы распознавания речи существуют давно. Например, Dragon Naturally Speaking, но, увы, их эффективность оставляет желать лучшего, особенно если произношение невнятное.

 Lars Kron

link 18.06.2015 9:01 

 wow1

link 18.06.2015 9:01 
эффективность сильно зависит от того, как вы train your Dragon

 NC1

link 18.06.2015 9:15 
Не бывает. Есть программы распознавания речи (например, уже упоминавшийся Dragon Naturally Speaking), но (а) их надо обучать пониманию речи одного конкретного человека, и (б) даже после обучения качество понимания ОЧЕНЬ сильно зависит от дикции этого самого конкретного человека.

Проблема настолько безнадежная с технической точки зрения, что уже появилась профессия "стеноговорилы" -- человек с хорошей дикцией одевает шумопоглощающую маску со встроенным в нее микрофоном (называется "стеномаска") и заново проговаривает то, что слышит, а компьютер уже распознает то, что ему наговорил "стеноговорила". Эту технологию применяли сначала на телевидении для генерации субтитров в прямых трансляциях, а потом она мало-помалу добралась и до судов -- "стеноговорилы" ввиду их более высокой производительности сейчас вытесняют стенотипистов, точно так же, как стенотиписты когда-то вытеснили стенографистов.

 wow1

link 18.06.2015 9:16 
надевает

 NC1

link 18.06.2015 9:20 
Hopefully... :)

 Supa Traslata

link 18.06.2015 9:46 
Кстати, Aiduza предложил реальный вариант (если незатейливые танцы с бубном не пугают аскера).

 wise crocodile

link 18.06.2015 9:53 
Правда, что смартфон с андроидом сработает лучше компа с драконом?

 Supa Traslata

link 18.06.2015 9:58 
Нет, особенно если произношение невнятное (с)

 Interex

link 18.06.2015 16:18 
Помогите найти программу, позволяющую распознавать текст из видео ... Голь на выдумки хитра.

 second opinion

link 18.06.2015 17:39 
одна программа из ларца распознает текст из видео, другая переводит, красота!... ага..:)

http://www.youtube.com/watch?v=RN0-QHZnvKk

 alk moderator

link 18.06.2015 18:15 
вообще, при современном обилии мобильных технологий распознавания речи при поиске даже странно, что нет нормального десктопного приложения. Да, распознавание речи, изображений и т.п. долгое время было неподдающимся компьютерам бастионом, но технология хэширования позволила подобраться к задаче с другой стороны, и крепость пала. Поиск картинки по образцу в Гугле, отгадывание мелодий в Shazam - все это прекрасно работает. Главные IT-корпорации, включая зла, добра и бабла, выпустили своих голосовых асисстентов: Siri, Cortana, Google Now, другие подтягиваются. Полагаю, ждать осталось не долго.

 second opinion

link 18.06.2015 19:00 
Широкое распространение дешевых мобильных технологий и особенно технологий распознавания и перевода речи нанесло тяжелый удар по офисному планктону и прежде всего по его наиболее многочисленной группе — переводчикам.
Билл Гейтс приводит выдержку из доклада одного из чиновников компании Гугол, который писал, что повсюду в офисах у компьютеров белеют кости устных и письменных переводчиков, разоренных конкуренцией со стороны мобильных технологий, получивших свое воплощение в универсальном десктопном приложении.

 00002

link 19.06.2015 6:49 
крепость пала. Поиск картинки по образцу в Гугле, отгадывание мелодий в Shazam - все это прекрасно работает.

У меня нет такого ощущения, что она уже пала. Конечно, прогресс имеется, еще несколько лет назад голосом можно было только в справочной Google телефоны по адресам искать, на английском, а сегодня можно уже прямо смс-ки набирать на русском. Но все же это не распознавание живой речи, а способ голосового ввода текста – наговаривать текст нужно не только "особо внятно", но и без каких-либо "непростейших" выражений, желательно максимально упрощая. И очень помогает (правильному распознаванию) также сразу же расставлять знаки препинания: здравствуйте восклицательный знак это я запятая как ваши дела вопросительный знак и при этом внимательно смотреть на результат, если не то – все стирать и наговаривать заново, иначе возможно непонимание адресатом, в лучшем случае :-) То есть до записи живой речи еще в ворота тараном долбить и долбить.

Поиски по картинкам и музыке – это другое, поисковик просто сличает картинку или аудио с базой и смотрит, есть ли в ней именно этот файл. Если есть – хорошо, если нет – не нашлось. Но когда заданное изображение не находится, то то, что он предлагает из похожего как правило не имеет с искомым образцом ничего "сущностно общего", совпадает в основном общий цветовой тон. Конкретный пример: ввел сейчас для пробы фото рукоятки дверного замка (отчетливо понятную для любого человека) – предлагает похожие по цветовой гамме картинки, но все типа автомобильных ступичных подшипников, ни одного замка, с ручкой или без.

То есть успехи есть, конечно, но переоценивать их пока не стоит.

 Aiduza

link 19.06.2015 9:07 
"И очень помогает (правильному распознаванию) также сразу же расставлять знаки препинания: здравствуйте восклицательный знак это я запятая как ваши дела вопросительный знак и при этом внимательно смотреть на результат, если не то – все стирать и наговаривать заново, иначе возможно непонимание адресатом, в лучшем случае :-) То есть до записи живой речи еще в ворота тараном долбить и долбить."
+100

Время от времени пользуюсь функцией распознавания речи на айфоне, но необходимость явно обозначать знаки препинания сильно утомляет и мешает свободному потоку сознания. :) В идеале, через несколько лет я ожидаю, что это будет похоже на то, как доктора и большие начальники из западных фильмов 80-х годов наговаривали на кассетные диктофоны тексты медицинских заключений и деловых писем для дальнейшего распознавания "живой" секретаршей. :)

и еще - кто-нибудь еще пробовал заставить смартфон правильно распознать текст песни "Точка, точка, запятая". %)))))

 Lonely Knight

link 19.06.2015 10:19 
"То есть успехи есть, конечно, но переоценивать их пока не стоит."
мне кажется, что со временем уровень делового общения просто упадет до уровня технологий. чем более будут доступны и распространены в повседневном общении всякие распознаватели и переводчики - тем более принятым и приемлемым станет выдаваемый ими продукт. вкупе с понижением общей грамотности благодаря более низкому уровню образования и интернетам...

 second opinion

link 19.06.2015 10:35 
Да просто документы, требующие перевода будут изначально генериться на нескольких нужных языках с использованием всплывающих подсказок, чтобы нейтрализовать неконтролируемую буйную фантазию масс. Степ бай степ ... передовыми технологиями вымощена дорога сами знаете куда...:)

 

You need to be logged in to post in the forum