Двухнедельный турнир по покеру между лучшей компьютерной программой и четырьмя профессионалами (из первой десятки рейтинга лучших игроков мира) закончился победой человека. Разработанная в Университете Карнеги-Меллон программа Claudico проиграла в безлимитный техасский холдем около 732 тысяч долларов. О научно значимых результатах турнира сообщается в пресс-релизе университета.
Соревнование проходило в питтсбургском казино Rivers. Люди и компьютер соревновались ежедневно с 11 утра до 10 вечера. Всего прошло около 80 тысяч раздач. Три игрока закончили турнир с выигрышем 529, 213 и 70 тысяч долларов, а один — с проигрышем 80 тысяч.
Однако при всей величине выигрыша превосходство людей на самом деле оказалось весьма шатким: 732 тысячи долларов при общем объеме ставок в 170 миллионов. Таким образом, истинным итогом оказалась статистическая ничья (сумма выигрыша не дотянула до статистически значимой).
«Наша цель — это не победить человека. Мы стремимся создать искусственный интеллект, который поможет людям принимать решения в ситуациях с множеством неизвестных фактов — в лечении болезней, в деловых переговорах, при покупке машины», — отметил главный разработчик Claudico Туомас Сандхольм (Tuomas Sandholm).
Стратегия системы опирается на ее собственные алгоритмы, а не на ходы и тактику известных игр с участием человека. Claudico уже сыграл сам с собой несколько триллионов партий. Запускаются эти алгоритмы на суперкомпьютере Blacklight, причем единственной информацией на вводе являются правила игры в покер.
К концу игры файлы со стратегией Claudico заняли около двух терабайт — гораздо больше, чем способны изучить исследователи.
Сильной стороной системы оказалась способность быстро и случайным образом переключаться между различными стратегиями, слабой — медленная настройка на манеру игры индивидуального противника.
«Это хороший, но не выдающийся игрок. Некоторые его ставки ставили меня в тупик. Вряд ли какой человек поставит 19 тысяч, чтобы сорвать банк 700 долларов. Зато Claudico никогда не теряет хладнокровия — даже огромный проигрыш не влияет на его дальнейшую игру», — поделился своими впечатлениями один из участников турнира Дуг Полк (Doug Polk).
Покер является важнейшим испытанием для искусственного интеллекта, так как это игра с неполной информацией, где участники обладают скрытым от остальных знанием о своих картах, а также могут использовать эту информацию в свою пользу (например, блефовать). Если в играх с полной информацией (например, шахматах, где оба игрока видят положение всех фигур на доске) искусственный интеллект или обыгрывает человека, или как минимум добивается паритета с ним, то над покером программисты безуспешно бьются с 2006 года (когда прошел первый ежегодный чемпионат по этой игре среди компьютеров).
В январе 2015 года канадским ученым удалось написать компьютерную программу, способную на слабое решение техасского холдема с лимитированными ставками. Иными словами, компьютер смог создать стратегию игры, настолько близкую к оптимальной, что никакой человек не способен обыграть его (со статистическим уровнем значимости) за всю свою жизнь.
Комментарии
и толпы промышленных роботов ломанутся экспроприировать экспроприаторов- роботов финансистов.
Человек незаменим тем, что в его сознании присутствует нравственное сознание, духовный опыт всего человечества.
А компьютер по определению работает как индивидуалист.
Но когда компы объединят в компьютерные сети, но в этих сетях не будет организован духовный поиск - а на это надеяться пока что не приходится - тогда ко всем нам придёт большой белый лис. Ещё бОльший, чем "рынок".
Так что - "будьте готовы!" (с)
Но в шахматы выигрывает - выиграет и здесь
Блеф - это обычный ход с вероятностью поражения.
Кот. может быть выше - при отказе от риска.
Комп подсчитывает способность конкретного типа к риску в разных ситуациях, и уровень его памяти и расчётливости и игры
===============
Миллионы лет назад.
На Земле были созданы условия (кем?) для возникновения человека.
Наше время.
Государства, созданные человеком, породили условия для возникновения ИскИн.
Но раз мы не знаем своего создателя, то и созданное нами не будет знать нас.
...........
Что же выходит? Самовоспроизводство человека заканчивается?
Похоже на то. Ведь к тому времени человек уже уничтожит своего создателя - тонкую пленку на поверхности Земли ...биосферу.
Но уже может различать лица, глаза, волнение. - тож как человек.
Температуру проще всего мерить, суету движений, даже потение рук, тем более - лба, покраснение, глубокие вздохи
Ну и учитывать по конкретного типа опыту : что есть артисты, покерфейс...
Обынковенный полиграф - детектор лжи, только без проводов - очень успешно враньё неопытных артисов видит.
Блеф можно угадать по характеру игрока прежде, по поведению игрока относительно игры : карт и ставок, и высчитывая вероятность - какие у него могут быть карты.
Если же игры суть - угадать, смотря в фейс, то с компом играть нет смысла : у того ни глаз, ни рожи )