Дракон, который слушает и повинуется

 

Dragon компании Nuance Communications позволяет управлять компьютером с помощью голоса

Уолтер Моссберг
Vedomosti.ru

11.10.2012

 

Я набираю этот текст, не прикасаясь к клавиатуре. Я надиктовываю его в текстовом процессоре на моем ноутбуке, используя программу, позволяющую не только записывать текст с голоса, но и редактировать, форматировать или удалять его.

Текстовым процессором дело не ограничивается — голосом я могу запускать и закрывать программы, давать команды для навигации в интернете, в том числе напрямую переходить к нужным страницам. Можно также создавать и отправлять электронные письма, устанавливать статус в Facebook или Twitter. Все это делает программа Dragon компании Nuance Communications, в моем случае — новейшая версия для компьютеров Macintosh, Dragon Dictate3.

Программа стоит $200, и для работы с ней потребуется некоторая подготовка. Стоит ли покупать ее, если учесть, что Apple недавно оснастила свои компьютеры средством диктовки Siri? У Dragon есть ряд преимуществ. Во-первых, Dragon позволяет с помощью голоса управлять компьютером. Во-вторых, Siri работает лишь при наличии доступа в интернет, а Dragon функционирует автономно.

В принципе, у Dragon очень много функций, но вам в основном потребуются всего две — диктовка и выполнение команд меню.

К программе прилагается микрофон с наушником, но можно использовать и другие устройства, включая микрофоны с интерфейсом Bluetooth. Приятно, что версия для Macintosh теперь позволяет расшифровывать надиктованные аудиофайлы, хотя точность распознавания при этом ниже, чем при диктовке в реальном времени.

Чтобы повысить качество распознавания, желательно сначала обучить программу, начитав некоторое количество прилагаемых текстов, — на это уйдет порядка 10 минут. Чтобы дополнительно увеличить словарь программы, можно с ее помощью проанализировать новые тексты, создаваемые вами, к тому же можно добавлять слова или их звуковые аналоги вручную.

Чтобы различить похожие слова, Dragon использует анализ контекста. Программа неплохо справляется с именами собственными, адресами, телефонными номерами и другими трудными фрагментами текстов, хотя тут нередки и ошибки. Впрочем, проблемы с распознаванием встречаются и в простых словах, и для исправления надо либо стирать ошибочный текст и наговаривать правильный заново, либо вызывать меню со списком альтернативных вариантов. Как всегда с программами распознавания, наилучшие результаты получаются при работе в тихом месте. Желательно также произносить сразу целые фразы.

В целом программа может быть весьма полезной, в первую очередь — людям с ограниченными возможностями зрения или тем, кому трудно набирать текст на клавиатуре.

WSJ, 9.10.2012, Александр Силонов