Вопросы с тегом «online-learning»

19
Внутреннее сожаление в онлайн-выпуклой оптимизации

«Онлайн выпуклая оптимизация» Зинкевича ( http://www.cs.cmu.edu/~maz/publications/ICML03.pdf ) обобщает алгоритмы обучения «минимизация сожаления» от линейных настроек до выпуклой настройки и дает хорошее «внешнее сожаление» , Есть ли подобное обобщение для внутреннего сожаления? (Я не совсем...

19
Каковы наилучшие возможные временные / ошибочные компромиссы для приближенного решения линейных программ?

Для конкретности рассмотрим LP для решения игры с нулевой суммой для двух игроков, где у каждого игрока есть действий. Предположим, что каждая запись матрицы выплат имеет самое большее 1 в абсолютном значении. Для простоты давайте не будем делать предположений об ограниченности.nnnAAA Предположим,...

19
Проблема Уоррена Баффета

Вот абстракция проблемы онлайн обучения / бандита, над которой я работал летом. Я не видел подобной проблемы раньше, и это выглядит довольно интересно. Если вы знаете о любой связанной работе, я был бы признателен за ссылки. Проблема Параметр для многоруких бандитов. У тебя есть N рук. У каждой...

16
Разделение между грубыми коррелированными равновесиями и коррелированными равновесиями

Я ищу примеры методов доказательства цены границ анархии, которые способны отделить цену анархии от грубого коррелированного равновесия (ограничивающий набор динамики без внешнего сожаления) от цены анархии над коррелированным равновесием (ограничивающий комплектация без своп-сожалений). Известны...

10
Каковы хорошие рекомендации по пониманию онлайн-обучения?

В частности, я прошу ресурсы, чтобы узнать о системах машинного обучения, которые могут обновлять свои соответствующие сети убеждений (или эквивалент) во время работы. Я даже сталкивался с несколькими, хотя не смог их добавить в закладки. Как вы можете себе представить, это довольно сложная тема...