Онлайн против автономного обучения?

38

В чем разница между автономным и онлайн обучением ? Это просто вопрос обучения по всему набору данных (в автономном режиме) или обучения постепенно (по одному экземпляру за раз)? Какие примеры алгоритмов используются в обоих?

грифон
источник

Ответы:

26

Онлайн обучение означает, что вы делаете это по мере поступления данных. Автономно означает, что у вас есть статический набор данных.

Итак, для онлайн-обучения у вас (как правило) больше данных, но у вас есть ограничения по времени. Еще одна проблема, которая может повлиять на онлайн-обучение, заключается в том, что ваши концепции со временем могут измениться.

Допустим, вы хотите создать классификатор для распознавания спама. Вы можете приобрести большой объем электронной почты, пометить его и обучить классификатору. Это было бы обучение в автономном режиме. Или вы можете взять всю электронную почту, поступающую в вашу систему, и постоянно обновлять свой классификатор (ярлыки могут быть немного сложными). Это будет онлайн обучение.

user549
источник
7
Да, и небольшое пояснение состоит в том, что алгоритмы онлайн-обучения, по крайней мере, как изучено в Машинном обучении, в основном предполагают, что ваша способность хранить примеры очень ограничена по сравнению с размером набора данных. В наиболее ограничивающем случае вы можете видеть только один пример за раз, а затем забыть его после того, как используете его для обновления классификатора.
Харлан
8

Термин «онлайн» перегружен, и поэтому вызывает путаницу в области машинного обучения.

Противоположностью «онлайн» является пакетное обучение. При пакетном обучении алгоритм обучения обновляет свои параметры после использования всей партии, тогда как при онлайн-обучении алгоритм обновляет свои параметры после обучения из 1 обучающего экземпляра. Мини-пакетное обучение является промежуточным пунктом между пакетным обучением с одной стороны и онлайн-обучением с другой.

Кроме того, «когда» данные поступают или могут ли они быть сохранены или нет, ортогональны онлайн или пакетному обучению.

Считается, что онлайн-обучение медленнее приближается к минимуму по сравнению с пакетным обучением. Однако в тех случаях, когда весь набор данных не помещается в памяти, использование онлайн-обучения является приемлемым компромиссом.

shark8me
источник
Я не думаю, что это правда. Вы описываете алгоритм оптимизации стохастического (или онлайн) градиентного спуска, который можно использовать как для онлайн, так и для автономной настройки задачи.
Данияр
Я полагаю, что «по мере поступления данных» относится к сетевым и автономным алгоритмам en.wikipedia.org/wiki/Online_algorithm. Я считаю, что OPs defn для онлайн-обучения явно делает это различие. Онлайновые алгоритмы -> процесс по мере поступления данных. Онлайн обучение -> постепенное обновление базовой модели в процессе обучения.
gokul_uf
4

Онлайн обучение (также называемое инкрементным обучением ): мы рассматриваем отдельную презентацию примеров. В этом случае каждый пример используется последовательно, как предписано алгоритмом обучения, а затем отбрасывается. Изменения веса, сделанные на данном этапе, зависят конкретно только от (текущего) представляемого примера и, возможно, от текущего состояния модели. Это естественная процедура для изменяющихся во времени правил, когда примеры могут быть недоступны вообще.

Обучение в автономном режиме : изменения веса зависят от всего набора данных (обучения), определяющего глобальную функцию стоимости. Примеры используются многократно, пока не будет достигнута минимизация этой функции стоимости.

FrankyBravo
источник