Внутреннее сожаление в онлайн-выпуклой оптимизации

19

«Онлайн выпуклая оптимизация» Зинкевича ( http://www.cs.cmu.edu/~maz/publications/ICML03.pdf ) обобщает алгоритмы обучения «минимизация сожаления» от линейных настроек до выпуклой настройки и дает хорошее «внешнее сожаление» , Есть ли подобное обобщение для внутреннего сожаления? (Я не совсем уверен даже, что именно это будет означать.)

Ноам
источник
Можно ли добавить краткое описание внутреннего сожаления к вопросу?
Мориц
В обычной «экспертной» настройке внутреннего сожаления будет означать, что в ретроспективе вы не захотите переключаться одно действие с другим, последовательно на протяжении всей истории. Бумага Блюма-Мансура, вероятно, является лучшим справочным материалом для внутреннего и внешнего сожаления: jmlr.csail.mit.edu/papers/volume8/blum07a/blum07a.pdf
Ноам

Ответы:

9

Попробуйте «Обучение без сожалений в выпуклых играх» Гордона, Гринвальда и Маркса http://portal.acm.org/citation.cfm?id=1390202 . Его абстрактное звучание звучит так, будто оно, вероятно, отвечает на ваш вопрос, или, по крайней мере, любой, кто отвечает на этот вопрос, цитирует или цитирует эту статью.

Уоррен Шуди
источник
0

Эта бумага Avrim Blum указывает на связь между внешним и внутренним сожалением. Согласно его аннотации, внешнее сожаление - это мера того, насколько плох алгоритм сравнивается с лучшим фиксированным действием, в то время как внутреннее сожаление сравнивается с лучшим вариантом этого метода (лучшей фиксированной перестановкой выходных данных, например, сообщением класса A всякий раз, когда исходный алгоритм сообщает класс б).

Александр Пассос
источник
1
Бумага Блюма-Мансура находится не в настройке «онлайн-выпуклой оптимизации», а скорее в линейной настройке «экспертов». Мой вопрос заключается в том, можно ли применить что-то подобное или какой-либо другой алгоритм прямого внутреннего сожаления в выпуклой обстановке.
Ноам