Я пытаюсь понять историю градиентного спуска и стохастического градиентного спуска . Градиентный спуск был изобретен в Коши в 1847 году. Общий метод решения проблем симуляций . С. 536–538. Подробнее об этом см. здесь .
С тех пор методы градиентного спуска продолжали развиваться, и я не знаком с их историей. В частности меня интересует изобретение стохастического градиентного спуска.
Ссылка, которая может быть использована в академической статье более чем приветствуется.
Ответы:
Стохастическому градиентному спуску предшествует стохастическая аппроксимация, впервые описанная Роббинсом и Монро в их статье «Метод стохастической аппроксимации» . Кифер и Вулфовиц впоследствии опубликовали свою статью « Стохастическая оценка максимума функции регрессии».что более узнаваемо для людей, знакомых с ML-вариантом стохастической аппроксимации (т.е. стохастическим градиентным спуском), как отметил Марк Стоун в комментариях. В 60-х годах было проведено множество исследований в этом направлении - Дворецкий, Пауэлл, Блум - все опубликованные результаты, которые мы принимаем сегодня как должное. Переход от метода Роббинса и Монро к методу Кифера Вулфовица является относительно небольшим скачком, и это просто переосмысление проблемы, чтобы затем перейти к стохастическому градиентному спуску (для задач регрессии). Вышеупомянутые статьи широко цитируются как предшественники Стохастического градиентного спуска, как упомянуто в этом обзоре Nocedal, Bottou и Curtis , который дает краткую историческую перспективу с точки зрения машинного обучения.
Я полагаю, что Кушнер и Инь в своей книге « Стохастическая аппроксимация и рекурсивные алгоритмы и приложения» предполагают, что это понятие использовалось в теории управления еще в 40-х годах, но я не помню, ссылались ли они на это или это было анекдотично, и у меня нет доступа к их книге, чтобы подтвердить это.
источник
Видеть
Я не уверен, что SGD был изобретен до этого в литературе по оптимизации - возможно, так и было, - но здесь я полагаю, что он описывает применение SGD для обучения персептрона.
Он называет это «двумя типами подкрепления».
Он также ссылается на книгу об этих "двухвалентных системах".
источник