Хороший вопрос.
Прежде всего, в Go у глубокого разума не было сверхчеловеческих противников, которые могли бы бросить вызов. Го двигатели не были нигде рядом с высшим уровнем лучших игроков-людей. В шахматах, однако, двигатели на 500 очков ELO сильнее, чем лучшие игроки. Это огромная разница. Объем работы, которая ушла в современные шахматные движки, ошеломляет. Мы говорим о миллионах часов в программировании, сотнях тысяч итераций. Это огромный массив знаний и работы. Преодолеть и превзойти все это за 4 часа ошеломляет.
Во-вторых, это не столько сам результат, который удивляет шахматистов, а то, как AlphaZero играет в шахматы. Весьма иронично, что система, в которой не было никаких человеческих знаний или опыта, играет больше всего, чем мы. Двигатели печально известны тем, что они играют некрасиво выглядящие движения, те, кому не хватает гармонии и т. Д. Трудно объяснить игрокам, не являющимся шахматами, но есть такая вещь, как «Искусственный ход», который часто встречают современные двигатели. AlphaZero так не играет. У него очень человеческий стиль, в котором он доминирует над фигурами противника с глубокой стратегической игрой и потрясающими жертвами позиции. AlphaZero играет так, как мы стремимся, сочетая глубокое позиционное понимание с точностью расчета двигателя.
Редактировать
О, и я забыл упомянуть кое-что о самом результате. Если вы не знакомы с компьютерными шахматами, это может показаться невероятным, но это так.
В эти дни границы победы, которые отделяют главные современные двигатели, тонки как бритва. В матче со 100 играми вы можете ожидать результат в виде 85 ничьих, 9 побед и 6 поражений, чтобы определить лучший двигатель.
AlphaZero 28 побед и 72 ничьи с нулевыми потерями был потусторонним сокрушением и был совершенно немыслим до момента, когда это произошло.
MCTS для шахмат пробовали в литературе с небольшим успехом. Предполагалось, что подход AlphaGo никогда не сработает в шахматах, может быть, в го, но не в шахматах. Внезапно Google объявил, что подход работает, и он побил сильнейшую шахматную программу в мире с очень значительным преимуществом.
До Google всех шахматных программистов учили, что создание эвристики в программировании двигателя было лучшей стратегией, чем машинное обучение. Независимо от того, как вы реализовали нейронные сети, он никогда не работал бы быстрее, чем куча инструкций 64-битных битбордов. AlphaGo бежал довольно медленно , но играл в сильнейшие шахматы.
источник
На основании статей, которые вы предоставляете, я вижу много уровней удивления в победе:
Шахматы - сложная игра, и у контрагента были лучшие мировые практики, у AlphaZero была tabula rasa.
Обучение заняло четыре часа, и AlphaZero не проиграл 100 матчей.
Стиль игры представлял собой инопланетную смесь человеческих и компьютерных движений, агрессивных и иногда казавшихся глупыми с жертвами, которые не имеют ни малейшего представления, но на самом деле делают будущий статус более сильным.
Количество возможностей, учитываемых за ход, было меньше, чем у противоположности, у AlphaZero было таинственное чувство интуиции или интуиция.
Ощущение огорчения возникло из-за количества обучающего материала, с которым AlphaZero построил сам себя, и ограничения по времени, которое, возможно, не давало традиционной машине достаточное количество времени.
источник