Вопросы с тегом «game-ai»

20
Как обрабатывать недопустимые движения в обучении подкреплению?

Я хочу создать ИИ, который может играть пять в ряд / гомоку. Как я уже упоминал в названии, я хочу использовать для этого обучение с подкреплением. Я использую метод градиента политики , а именно REINFORCE, с базовым уровнем. Для приближения значения и функции политики я использую нейронную сеть ....

15
Как выбрать лучший алгоритм для настольной игры, такой как шашки?

Как выбрать лучший алгоритм для настольной игры, такой как шашки? До сих пор я рассмотрел только три алгоритма, а именно минимакс, альфа-бета-обрезку и поиск по дереву Монте-Карло (MCTS). По-видимому, и альфа-бета-обрезка, и MCTS являются расширениями базового минимаксного...

13
Кодирование ввода / вывода для нейронной сети для изучения игры на основе сетки

Я пишу простую игрушечную игру, целью которой является обучение глубокой нейронной сети. Правила игры примерно следующие: В игре есть доска, состоящая из шестиугольных ячеек. Оба игрока имеют одинаковую коллекцию фигур, которую они могут свободно размещать на доске. Размещая различные типы фигур,...

11
Как подготовить нейронную сеть для круглой настольной игры?

Мне интересно, как подготовить нейронную сеть для настольной игры, основанной на раундах, такой как крестики-нолики, шахматы, риск или любая другая игра на основе раундов. Получить следующий ход по логическому выводу, кажется, довольно просто, путем подачи состояния игры в качестве входных данных и...

11
Является ли AlphaZero примером AGI?

Из исследовательской работы DeepMind на arxiv.org: В этой статье мы применяем аналогичный, но полностью универсальный алгоритм, который мы называем AlphaZero , к играм в шахматы и сёги, а также в го без каких-либо дополнительных знаний предметной области, кроме правил игры, демонстрируя, что...

10
Может ли нейронная сеть выработать концепцию расстояния?

Представьте себе игру, в которой черный экран отделен от красного и синего пикселей. Передав эту игру человеку, они сначала увидят, что нажатие клавиш со стрелками переместит красный пиксель. Следующая вещь, которую они попытаются, это переместить красный пиксель на синий пиксель. Отдайте эту игру...

9
Несколько сомнений относительно применения обучения с подкреплением в таких играх, как шахматы

Я изобрел шахматную настольную игру. Я построил двигатель, чтобы он мог играть автономно. Двигатель в основном дерево решений. Он состоит из: Функция поиска, которая на каждом узле находит все возможные законные ходы Функция оценки, которая присваивает числовое значение позиции на доске...

9
Поиск по дереву Монте-Карло квалифицируется как машинное обучение?

Насколько я понимаю, алгоритм поиска дерева Монте-Карло (MCTS) является альтернативой минимаксному поиску дерева узлов. Он работает, выбирая ход (как правило, тот, у которого больше шансов быть лучшим), а затем выполняя случайную игру на ходу, чтобы посмотреть, каков будет результат. Этот процесс...