Subject: Помогите найти программу, позволяющую распознавать текст из видео for.pol. Есть несколько файлов интервью в формате mov. Клиент просит перепечатать текст из этих файлов. Язык русский.
|
Таких программ нет |
|
link 18.06.2015 8:47 |
не может такого быть |
Если на ютьюбе есть встроенная утилита распознавания речи, то, возможно, и программа такая существует. Главное, что есть технология. |
если совсем отчаялись, то вот вам метод "через заднее крыльцо": Создайте новое сообщение на смартфоне (с операционной системой Android, iOS...). Поднесите смартфон к динамику компьютера и нажмите на клавиатуре кнопочку с изображением микрофона. Убедитесь, что выбрали раскладку клавиатуры, соответствующую языку видеоролика. Удачи. :) |
да вон уже очередной раз заодно и переводчиков отменили: http://speechpad.ru/ |
|
link 18.06.2015 9:00 |
Программы распознавания речи существуют давно. Например, Dragon Naturally Speaking, но, увы, их эффективность оставляет желать лучшего, особенно если произношение невнятное. |
эффективность сильно зависит от того, как вы train your Dragon |
Не бывает. Есть программы распознавания речи (например, уже упоминавшийся Dragon Naturally Speaking), но (а) их надо обучать пониманию речи одного конкретного человека, и (б) даже после обучения качество понимания ОЧЕНЬ сильно зависит от дикции этого самого конкретного человека. Проблема настолько безнадежная с технической точки зрения, что уже появилась профессия "стеноговорилы" -- человек с хорошей дикцией одевает шумопоглощающую маску со встроенным в нее микрофоном (называется "стеномаска") и заново проговаривает то, что слышит, а компьютер уже распознает то, что ему наговорил "стеноговорила". Эту технологию применяли сначала на телевидении для генерации субтитров в прямых трансляциях, а потом она мало-помалу добралась и до судов -- "стеноговорилы" ввиду их более высокой производительности сейчас вытесняют стенотипистов, точно так же, как стенотиписты когда-то вытеснили стенографистов. |
надевает |
Hopefully... :) |
|
link 18.06.2015 9:46 |
Кстати, Aiduza предложил реальный вариант (если незатейливые танцы с бубном не пугают аскера). |
|
link 18.06.2015 9:53 |
Правда, что смартфон с андроидом сработает лучше компа с драконом? |
|
link 18.06.2015 9:58 |
Нет, особенно если произношение невнятное (с) |
Помогите найти программу, позволяющую распознавать текст из видео ... Голь на выдумки хитра. |
|
link 18.06.2015 17:39 |
одна программа из ларца распознает текст из видео, другая переводит, красота!... ага..:) |
вообще, при современном обилии мобильных технологий распознавания речи при поиске даже странно, что нет нормального десктопного приложения. Да, распознавание речи, изображений и т.п. долгое время было неподдающимся компьютерам бастионом, но технология хэширования позволила подобраться к задаче с другой стороны, и крепость пала. Поиск картинки по образцу в Гугле, отгадывание мелодий в Shazam - все это прекрасно работает. Главные IT-корпорации, включая зла, добра и бабла, выпустили своих голосовых асисстентов: Siri, Cortana, Google Now, другие подтягиваются. Полагаю, ждать осталось не долго. |
|
link 18.06.2015 19:00 |
Широкое распространение дешевых мобильных технологий и особенно технологий распознавания и перевода речи нанесло тяжелый удар по офисному планктону и прежде всего по его наиболее многочисленной группе — переводчикам. Билл Гейтс приводит выдержку из доклада одного из чиновников компании Гугол, который писал, что повсюду в офисах у компьютеров белеют кости устных и письменных переводчиков, разоренных конкуренцией со стороны мобильных технологий, получивших свое воплощение в универсальном десктопном приложении. |
крепость пала. Поиск картинки по образцу в Гугле, отгадывание мелодий в Shazam - все это прекрасно работает. У меня нет такого ощущения, что она уже пала. Конечно, прогресс имеется, еще несколько лет назад голосом можно было только в справочной Google телефоны по адресам искать, на английском, а сегодня можно уже прямо смс-ки набирать на русском. Но все же это не распознавание живой речи, а способ голосового ввода текста – наговаривать текст нужно не только "особо внятно", но и без каких-либо "непростейших" выражений, желательно максимально упрощая. И очень помогает (правильному распознаванию) также сразу же расставлять знаки препинания: здравствуйте восклицательный знак это я запятая как ваши дела вопросительный знак и при этом внимательно смотреть на результат, если не то – все стирать и наговаривать заново, иначе возможно непонимание адресатом, в лучшем случае :-) То есть до записи живой речи еще в ворота тараном долбить и долбить. Поиски по картинкам и музыке – это другое, поисковик просто сличает картинку или аудио с базой и смотрит, есть ли в ней именно этот файл. Если есть – хорошо, если нет – не нашлось. Но когда заданное изображение не находится, то то, что он предлагает из похожего как правило не имеет с искомым образцом ничего "сущностно общего", совпадает в основном общий цветовой тон. Конкретный пример: ввел сейчас для пробы фото рукоятки дверного замка (отчетливо понятную для любого человека) – предлагает похожие по цветовой гамме картинки, но все типа автомобильных ступичных подшипников, ни одного замка, с ручкой или без. То есть успехи есть, конечно, но переоценивать их пока не стоит. |
"И очень помогает (правильному распознаванию) также сразу же расставлять знаки препинания: здравствуйте восклицательный знак это я запятая как ваши дела вопросительный знак и при этом внимательно смотреть на результат, если не то – все стирать и наговаривать заново, иначе возможно непонимание адресатом, в лучшем случае :-) То есть до записи живой речи еще в ворота тараном долбить и долбить." +100 Время от времени пользуюсь функцией распознавания речи на айфоне, но необходимость явно обозначать знаки препинания сильно утомляет и мешает свободному потоку сознания. :) В идеале, через несколько лет я ожидаю, что это будет похоже на то, как доктора и большие начальники из западных фильмов 80-х годов наговаривали на кассетные диктофоны тексты медицинских заключений и деловых писем для дальнейшего распознавания "живой" секретаршей. :) и еще - кто-нибудь еще пробовал заставить смартфон правильно распознать текст песни "Точка, точка, запятая". %))))) |
|
link 19.06.2015 10:19 |
"То есть успехи есть, конечно, но переоценивать их пока не стоит." мне кажется, что со временем уровень делового общения просто упадет до уровня технологий. чем более будут доступны и распространены в повседневном общении всякие распознаватели и переводчики - тем более принятым и приемлемым станет выдаваемый ими продукт. вкупе с понижением общей грамотности благодаря более низкому уровню образования и интернетам... |
|
link 19.06.2015 10:35 |
Да просто документы, требующие перевода будут изначально генериться на нескольких нужных языках с использованием всплывающих подсказок, чтобы нейтрализовать неконтролируемую буйную фантазию масс. Степ бай степ ... передовыми технологиями вымощена дорога сами знаете куда...:) |
You need to be logged in to post in the forum |