Dragon компании Nuance Communications позволяет управлять компьютером с помощью голоса
Я набираю этот текст, не прикасаясь к клавиатуре. Я надиктовываю его в текстовом процессоре на моем ноутбуке, используя программу, позволяющую не только записывать текст с голоса, но и редактировать, форматировать или удалять его.
Текстовым процессором дело не ограничивается — голосом я могу запускать и закрывать программы, давать команды для навигации в интернете, в том числе напрямую переходить к нужным страницам. Можно также создавать и отправлять электронные письма, устанавливать статус в Facebook или Twitter. Все это делает программа Dragon компании Nuance Communications, в моем случае — новейшая версия для компьютеров Macintosh, Dragon Dictate3.
Программа стоит $200, и для работы с ней потребуется некоторая подготовка. Стоит ли покупать ее, если учесть, что Apple недавно оснастила свои компьютеры средством диктовки Siri? У Dragon есть ряд преимуществ. Во-первых, Dragon позволяет с помощью голоса управлять компьютером. Во-вторых, Siri работает лишь при наличии доступа в интернет, а Dragon функционирует автономно.
В принципе, у Dragon очень много функций, но вам в основном потребуются всего две — диктовка и выполнение команд меню.
К программе прилагается микрофон с наушником, но можно использовать и другие устройства, включая микрофоны с интерфейсом Bluetooth. Приятно, что версия для Macintosh теперь позволяет расшифровывать надиктованные аудиофайлы, хотя точность распознавания при этом ниже, чем при диктовке в реальном времени.
Чтобы повысить качество распознавания, желательно сначала обучить программу, начитав некоторое количество прилагаемых текстов, — на это уйдет порядка 10 минут. Чтобы дополнительно увеличить словарь программы, можно с ее помощью проанализировать новые тексты, создаваемые вами, к тому же можно добавлять слова или их звуковые аналоги вручную.
Чтобы различить похожие слова, Dragon использует анализ контекста. Программа неплохо справляется с именами собственными, адресами, телефонными номерами и другими трудными фрагментами текстов, хотя тут нередки и ошибки. Впрочем, проблемы с распознаванием встречаются и в простых словах, и для исправления надо либо стирать ошибочный текст и наговаривать правильный заново, либо вызывать меню со списком альтернативных вариантов. Как всегда с программами распознавания, наилучшие результаты получаются при работе в тихом месте. Желательно также произносить сразу целые фразы.
В целом программа может быть весьма полезной, в первую очередь — людям с ограниченными возможностями зрения или тем, кому трудно набирать текст на клавиатуре.
WSJ, 9.10.2012, Александр Силонов
Комментарии