Войти в аккаунт
Хотите наслаждаться полной версией, а также получить неограниченный доступ ко всем материалам?

Voice Digger - первый поисковик по фонограммам русской речи

Voice Digger - первый поисковик по фонограммам русской речи

«Центр речевых технологий» объявил о завершении работ над технологией Voice Digger — поиском «ключевых» слов в фонограммах русской речи. Это первая в России коммерческая разработка в области audio data mining — одного из самых перспективных направлений цифрового компьютерного рынка в мире.

Разработанный «Центром речевых технологий» Voice Digger — первый отечественный поиск по ключевым словам в звукозаписях русской речи. Voice Digger позволяет автоматически выделять ключевые слова и словосочетания в потоке слитной речи без предварительного прослушивания. Разработка основана на непрерывном распознавании речи, реализуемом с использованием теории скрытых марковских процессов(НММ). Ключевые слова задаются в виде обычного текста, по которому система строит НММ-модель каждого слова. На выходе VoiceDigger предоставляет ссылку на звуковой документ и местоположение искомого слова или словосочетания.

Специалист по компьютерной лингвистике Виктор Бочаров рассказал, что качество системы поиска ключевых слов определяется двумя показателями: вероятности обнаружения ключевого слова и вероятности ложного срабатывания при заданной длине искомого слова. Обычно пользователь может регулировать чувствительность системы в зависимости от того, что для него хуже: пропустить произнесение слова или получить много ложных срабатываний. В «Центре речевых технологий» сообщили, что уровень ошибки системы составляет порядка 8%.

Участники рынка сулят новой разработке серьезные перспективы. Андрей Терехов, генеральный директор «Ланит-терком» говорит: «Если новая разработка действительно позволяет распознавать около 90% процентов речевого потока, который записан без особых стараний со стороны говорящего, без «вычеканивания» каждого слова, то, безусловно, эту технологию можно назвать прорывом в области audio data mining». Согласен с ним и Виктор Бочаров. Он уверен, что у данной технологии хорошие перспективы, так как появляется возможность производить поиск по большому количеству информации, существующему только в звуковой форме. «Я думаю, что интеграция этой функции в поисковые системы будет пользоваться успехом у пользователей», — полагает лингвист.

В ЦРТ считают, что новая технология будет пользоваться спросом в крупных системах обработки, хранения и анализа данных. Модули, созданные на базе Voice Digger, позволят оперативно обработать не только текстовые, но и мультимедиа-данные и получить на выходе систематизированные выборки по интересующей пользователя тематике.

В качестве примера аналогичной западной разработки можно привести компанию TVEyes. Фирма создала поиск по содержимому аудио- и видеопотоков. TVEyes предоставляет своим клиентам возможность производить поиск по ключевым словам среди содержимого ведущих телеканалов и радиостанций США, Канады, Великобритании и Австралии. Для отдельного пользователя пользование услугами TVEyes в зависимости от предоставляемых возможностей составляет от $0 до $5000 в месяц.

Огромное количество аудио и видеофайлов, выложенное в интернете, даёт большое поле для расширения сферы поиска традиционных поисковиков. Ранее Google сообщал о том, что в 2006 г. будет запущен интернет-поиск по содержимому аудиофайлов, но этого пока не произошло. В «Яндексе» отмечают, что в силу ограниченности вычислительных мощностей время для этого еще не пришло. «Количество аудиофайлов в Рунете исчисляется миллионами и заранее неизвестно, является ли файл музыкой или речью, на русском или английском. Качество распознавания и скорость обработки могут стать препятствием для индексации больших массивов речевой информации», — считает Александр Садовский, руководитель отдела веб-поиска «Яндекса».

Тем не менее, генеральный директор «Центра речевых технологий» Михаил Хитров уверен, что у разработки его компании есть большие перспективы: «В связи со все более активным использованием естественного интерфейса и, в частности голоса, для общения с техникой возросло и значение аудиозаписи как единицы носителя информации. Появилась потребность в системах, способных быстро и эффективно обслуживать аудио архивы и находить нужную информацию в большом объеме записи».

Источник: www.cnews.ru

{{ rating.votes_against }} {{ rating.rating }} {{ rating.votes_for }}

Комментировать

осталось 1800 символов
Свернуть комментарии

Все комментарии (0)

×
Заявите о себе всем пользователям Макспарка!

Заказав эту услугу, Вас смогут все увидеть в блоке "Макспаркеры рекомендуют" - тем самым Вы быстро найдете новых друзей, единомышленников, читателей, партнеров.

Оплата данного размещения производится при помощи Ставок. Каждая купленная ставка позволяет на 1 час разместить рекламу в специальном блоке в правой колонке. В блок попадают три объявления с наибольшим количеством неизрасходованных ставок. По истечении периода в 1 час показа объявления, у него списывается 1 ставка.

Сейчас для мгновенного попадания в этот блок нужно купить 1 ставку.

Цена 10.00 MP
Цена 40.00 MP
Цена 70.00 MP
Цена 120.00 MP
Оплата

К оплате 10.00 MP. У вас на счете 0 MP. Пополнить счет

Войти как пользователь
email
{{ err }}
Password
{{ err }}
captcha
{{ err }}
Обычная pегистрация

Зарегистрированы в Newsland или Maxpark? Войти

email
{{ errors.email_error }}
password
{{ errors.password_error }}
password
{{ errors.confirm_password_error }}
{{ errors.first_name_error }}
{{ errors.last_name_error }}
{{ errors.sex_error }}
{{ errors.birth_date_error }}
{{ errors.agree_to_terms_error }}
Восстановление пароля
email
{{ errors.email }}
Восстановление пароля
Выбор аккаунта

Указанные регистрационные данные повторяются на сайтах Newsland.com и Maxpark.com