Я ищу учебник / лекционные заметки в обучении подкреплению. Мне нравится «Введение в статистическое обучение» , но, к сожалению, они не охватывают эту тему. Я знаю, что книга Саттона и Барто является стандартным справочником, и, возможно, НДП также хороша, но они датированы 1997-98 гг., И я надеялся найти более современную экспозицию, поскольку эта область, вероятно, получит довольно широкое развитие в последнее время. время.
источник
Возможно, вы захотите проверить « Алгоритмы обучения усилению » Чабы Шепешвари, опубликованные в 2010 году. PDF можно загрузить с веб-сайта. На мой взгляд, он немного более технический, чем Саттон и Барто, но охватывает меньше материала.
источник
Вот несколько хороших учебников / ссылок:
классический
Саттон Р.С., Барто АГ. Усиление обучения: введение. Кембридж, Массачусетс: Книга Брэдфорда; 1998. 322 с.
Черновик для второго издания доступен бесплатно: https://webdocs.cs.ualberta.ca/~sutton/book/the-book.html.
Рассел / Норвиг Глава 21:
Рассел С.Дж., Норвиг П., Дэвис Э. Искусственный интеллект: современный подход. Аппер-Седл-Ривер, Нью-Джерси: Прентис Холл; 2010.
Более технический
Szepesvári C. Алгоритмы для обучения с подкреплением. Обобщающие лекции по искусственному интеллекту и машинному обучению. 2010; 4 (1): 1-103. http://www.ualberta.ca/~szepesva/RLBook.html
Берцекас Д.П. Динамическое программирование и оптимальное управление. 4-е издание. Belmont, Mass .: Athena Scientific; 2007. 1270 с. Глава 6, том 2 доступен бесплатно: http://web.mit.edu/dimitrib/www/dpchapter.pdf
Для более свежих разработок
Виринг М, ван Оттерло М, редакция. Усиление обучения. Берлин, Гейдельберг: Springer Berlin Heidelberg; 2012 Доступно с: http://link.springer.com/10.1007/978-3-642-27645-3
Kochenderfer MJ, Amato C, Chowdhary G, How JP, Reynolds HJD, Thornton JR, et al. Принятие решений в условиях неопределенности: теория и применение. 1 издание. Кембридж, Массачусетс: MIT Press; 2015. 352 с.
Многоагентное обучение с подкреплением
Buşoniu L, Babuška R, Schutter BD. Многоагентное обучение по усилению: обзор. В кн .: Сринивасан Д., Джайн Л.К., редакторы. Инновации в многоагентных системах и приложениях - 1. Springer Berlin Heidelberg; 2010 р. 183-221. Доступно по адресу: http://link.springer.com/chapter/10.1007/978-3-642-14435-6_7.
Шварц Х.М. Многоагентное машинное обучение: подход подкрепления. Хобокен, Нью-Джерси: Wiley; 2014.
Видео / Курсы
Я бы также предложил курс Дэвида Сильвера на YouTube: https://www.youtube.com/playlist?list=PL5X3mDkKaJrL42i_jhE4N-p6E2Ol62Ofa
источник
Мои любимые конспекты лекций по обучению подкреплению - Эндрю Нг из Стэнфордского курса по ML CS229:
Учебные записки по ремонту Stanford CS229
Вы также можете скачать видео лекции на iTunes. Или на YouTube, они начинаются по следующей ссылке:
Лекция 16 CS229
источник