«Онлайн выпуклая оптимизация» Зинкевича ( http://www.cs.cmu.edu/~maz/publications/ICML03.pdf ) обобщает алгоритмы обучения «минимизация сожаления» от линейных настроек до выпуклой настройки и дает хорошее «внешнее сожаление» , Есть ли подобное обобщение для внутреннего сожаления? (Я не совсем уверен даже, что именно это будет означать.)
19
Ответы:
Попробуйте «Обучение без сожалений в выпуклых играх» Гордона, Гринвальда и Маркса http://portal.acm.org/citation.cfm?id=1390202 . Его абстрактное звучание звучит так, будто оно, вероятно, отвечает на ваш вопрос, или, по крайней мере, любой, кто отвечает на этот вопрос, цитирует или цитирует эту статью.
источник
Эта бумага Avrim Blum указывает на связь между внешним и внутренним сожалением. Согласно его аннотации, внешнее сожаление - это мера того, насколько плох алгоритм сравнивается с лучшим фиксированным действием, в то время как внутреннее сожаление сравнивается с лучшим вариантом этого метода (лучшей фиксированной перестановкой выходных данных, например, сообщением класса A всякий раз, когда исходный алгоритм сообщает класс б).
источник