Кто вы, «Уотсон»? IBM разработала компьютер, отвечающий на вопросы

На модерации Отложенный

«Посетите Бурдж в этом городе в ОАЭ. Говорят, это самая высокая башня в мире. Не перегибайтесь за ограждение — вас может стошнить». Это не вопрос. Это задача популярного в США телешоу Jeopardy!, которое российскому телезрителю хорошо известно под названием «Своя игра». Хотя задачка и не сформулирована как вопрос, у неё есть ответ — Дубаи. И этот ответ компьютер Watson находит быстрее, чем другие участники викторины — люди.

«Космическая одиссея» Стэнли Кубрика — удивительный фильм. Это эпос о выходе человека в Большой Космос (именно так, с прописных букв), о том, как человечество покидает свою земную колыбель и устремляется к звёздам, в ещё не познанную бесконечность Вселенной. Снятый до появления современных цифровых технологий фильм завораживает до сих пор как будто бы снятыми с натуры ландшафтами далёких планет и звёздных пространств. Но вот странность: его самый запоминающийся персонаж — это вовсе не космонавты, покорители глубин космоса, а HAL 9000 — компьютер космического корабля. Его мощный искусственный интеллект способен отвечать на вопросы и совершать поступки, например, убивать, но не способен превратить его в человека.

Великое произведение искусства тем и отличается от художественной текучки, что способно сделать архетипом носящиеся в воздухе культуры идеи. Таким шедевром и стал фильм Кубрика, который воплотил два главных научно-фантастических мифа ХХ века — о покорении космоса и искусственном интеллекте, а заодно и подсветил две важные проблемы: что на самом деле нужно человеку от космоса? что принесёт человеку создание своего компьютерного подобия?

С космосом всё более-менее понятно: порыв первых десятилетий освоения околоземного пространства перегорел, и нынешнее человечество пока будет отсиживаться на планете, активно используя для совершенно земных нужд только орбиту да время от времени засылая в дальний космос аппараты. Компьютерам повезло больше — если бы космос осваивался такими же темпами, с какими совершенствуются космические технологии, человечество, вероятно, уже обосновалось бы на Марсе. По Красной планете, однако, пока ездят автоматы, а практически всё нужное для построения HAL 9000 уже есть.

«Посетите Бурдж в этом городе в ОАЭ. Говорят, это самая высокая башня в мире. Не перегибайтесь за ограждение — вас может стошнить». Это не вопрос. Это задача популярного в США телешоу Jeopardy!, которое российскому телезрителю хорошо известно под названием «Своя игра». Хотя задачка и не сформулирована как вопрос, у неё есть ответ — Дубаи. И этот ответ компьютер Watson выдаёт быстрее, чем другие участники викторины — люди. «Уотсон» обязан своим именем вовсе не приятелю Шерлока Холмса. Он назван так в честь Томаса Джона Уотсона, когда-то превратившего Computing Tabulating Recording Corporation в IBM и ставшего её первым президентом. Большие правительственные заказы (злые языки говорят — не только от США, но и от Третьего рейха), которые всегда кормили IBM, требовали и соответствующих машин. Поэтому путь IBM — большие компьютеры, решающие сложные задачи.

Задача, поставленная перед группой разработчиков «Уотсона», крайне амбициозна: построить самую продвинутую машину, «отвечающую на вопросы», которая могла бы понимать вопросы, заданные на простом человеческом — естественном — языке, и давать на них содержательные ответы. Эта задача сложнее, чем та, которая стоит перед поисковыми системами типа Google, поскольку в ответ на запрос в поисковой строке они выдают не ответы, а ссылки на документы, в которых пользователь должен найти ответ уже сам. Ограниченная способность поисковиков «понимать» вопросы даже приводит к «гуглизации» самих пользователей, которые потихоньку привыкают давать запросы с ключевыми словами, типа «Москва ресторан суши».

Поисковики, впрочем, тоже не стоят на месте, теперь выдавая не просто ссылки, но вместе со ссылкой на веб-страницу и фрагмент текста, который, возможно, и содержит ответ. Последний тренд развития поисковых систем — так называемый «вертикальный поиск», то есть узкий поиск ответов по какой-то одной теме с помощью программного обеспечения, разработанного специально для такого рода запросов.

Однако «понимание» естественного языка — это совсем другой уровень развития компьютерных технологий, поскольку он позволит машине вести с людьми разговор, просто отвечая на вопросы и не требуя набора ключевых слов. Вопросы «Своей игры» — хороший пример не слишком сложных в плане информации, но исключительно сложных с точки зрения компьютерной лингвистики вопросов, в которых важную роль играют намёки и иносказания.

IBM считает, что практически справилась с этой задачей, и даже собирается в ближайшее время вывести своего «Уотсона» в прямой эфир телешоу уже осенью 2010 года. Если «Уотсон» обыграет лучших игроков США, то IBM повторит, уже на новом уровне, свой подвиг тринадцатилетней давности, когда в 1997 году на глазах у всей планеты её суперкомпьютер Deep Blue в честной борьбе обыграл чемпиона мира по шахматам Гарри Каспарова. «Уотсону» будет даже сложнее — так же как и другие участники викторины-люди, он не сможет обратиться к интернету, весь запас информации, которая может понадобится ему для ответов, должен будет храниться прямо в нём самом.

IBM не единственная компания, пытающаяся создать компьютер, с которым можно коммуницировать на естественном языке.

Инженеры компании Стивена Вольфрама создали свою «машину для ответов» — Wolfram|Alpha. «Альфа» тоже пытается отвечать на вопросы, но круг её тем, в которых она, надо сказать, «разбирается» очень хорошо, — это научные факты и закономерности практически по всем отраслям человеческого знания. Она с лёгкостью справляется с решением сложнейших уравнений и конкретных вопросов — типа соотношения ВВП Франции и Германии или погоды в Шереметьево. Но задачка про Дубаи ей пока не по зубам. Впрочем, Вольфрама не слишком интересуют обыденная жизнь и повседневная культура, его интересует наука.

Впрочем, и приниципы работы «Альфы» и «Уотсона» радикально отличаются. Разработка «Альфы» потребовала от компании Стивена Вольфрама нескольких лет, которые ушли на создание специализированых баз данных — на основе энциклопедий, справочников, учебников и т. д., — которые позволяют, предположим, сравнивать население двух городов. Машина должна «понимать», что её спрашивают именно о городах, а, например, не о странах, что «население» — это не этнический состав, а количество жителей, и т. д. Собственно, по этому пути — разработки баз данных и компьютерных словарей — по преимуществу и идут до сих пор создатели «отвечающих машин».

Разработчики «Уотсона» во главе с Дэвидом Ферруччи, старшим менеджером отдела семантического анализа компании, положили в основу работы своей машины статистический анализ текстов, похожий на тот, которым пользуются поисковики. Слово «Москва» значительно чаще будет попадаться в сети вместе со словом «город» или «столица России», чем со словом «гостиница». Машину можно не «учить» тому, что «Москва — это город» или «Москва — столица России». Проанализировав кучу текстов, причём не только научных текстов и энциклопедий, но и литературных произведений, сценариев фильмов, расшифровок телепередач и т. д., компьютер сам сможет «понять», что это такое. Точнее, конечно, не «понять», а связать два понятия. Что не мешает разработчикам «учить» его, настраивать на поиск самых подходящих ассоциаций.

«Уотсон», впрочем, этим не ограничивается. Он не просто обрабатывает гигантское количество документов, причём за очень малое время (его обслуживает мощный суперкомпьютерный кластер IBM), но упражняется в ранжировании ответов по их релевантности и, кроме того, старается проверить ответ, подставляя его в запрос к той же базе документов. Его статистической программе по зубам и поиск сложных ассоциаций, которые позволяют ему правильно отвечать на каверзные и непрямые вопросы.

Разработка машины для ответов — задача не только амбициозная, но и вполне практичная. Победа Deep Blue над Каспаровым, в общем, не принесла IBM ничего, кроме славы. Шахматы, как бы ни были они сложны, построены на довольно простой логике, с которой теперь справляется даже обычный ПК. Масштабировать это достижение или перенести его в другую сферу использования оказалось проблематичным. Другое дело — работа с естественным языком. На этот счёт у IBM, а также у её коллег и конкурентов, в частности Microsoft, вполне конкретные планы. Такие компьютеры могут пригодиться американским юристам, ищущим в груде юридическим документов ответы на сложные вопросы судейской практики. Не откажутся от быстрой (а это особенно важно в медицине) подсказки Watson M. D. врачи. «Уотсон» поможет и при решении чрезвычайных ситуаций, требующих мгновенного анализа огромного массива данных и учёта всех возможных проблем. Предварительные планы продаж у IBM уже есть — «Уотсоны» могут поступить в продажу уже через два года и будут стоить несколько миллионов долларов.

Есть у машин для ответов и другое предназначение — работать в колл-центрах. Эта работа даже проще, чем отвечать на вопросы «Своей игры», поскольку людей, звонящих в службу поддержки, не интересует цвет шляпы Шерлока Холмса, но волнует, как настроить интернет-соединение или телевизор. А потому и база данных, с которой будет работать компьютер, будет значительно меньше. Но понимать вопросы и отвечать машине придётся на «естественном» языке, вслух. «Уотсон» пока не «обучен» распознаванию речи, но это не беда — на компьютерном рынке последние несколько лет уже есть технологии, которые с довольно большой эффективностью справляются с этой задачей. Более того, некоторые компании, например Panasonic, уже оснащают ими свои колл-центры, переадресуя машинам относительно несложные вопросы, а в исследовательском подразделении Microsoft тестируются компьютерные персональные помощники и программные ассистенты для врачей. Старается не отставать и Apple, недавно за 200 миллионов долларов купившая молодую компанию Siri, производителя одноименной программы для iPhone, которая записывает вопрос владельца смартфона, отсылает его на распознавание в аутсорсинговый центр компании Nuance Communications, а потом, получив расшифровку, пытается дать ответ на основе поиска в интернете.

Развитие технологий постепенно идёт к тому, что общение с компьютером, как в фантастических фильмах, станет таким же простым, как общение между людьми. Вопрос только в том, сможет ли человечество узнать ответ на вопрос, когда стоит остановиться. Когда следует брать решение на себя, а не доверять его компьютеру? Ответа на этот вопрос пока нет. Интересно, что ответил бы на него HAL 9000? У «Уотсона» можно будет спросить уже скоро.