В чем разница между автономным и онлайн обучением ? Это просто вопрос обучения по всему набору данных (в автономном режиме) или обучения постепенно (по одному экземпляру за раз)? Какие примеры алгоритмов используются в...
Онлайн-алгоритмы относятся к вычислениям, которые выполняются итеративно, с поступлением данных во время вычислений. По вопросам, касающимся Интернета, используйте тег «Интернет».
В чем разница между автономным и онлайн обучением ? Это просто вопрос обучения по всему набору данных (в автономном режиме) или обучения постепенно (по одному экземпляру за раз)? Какие примеры алгоритмов используются в...
В документе «Точное вычисление текущей дисперсии» по адресу http://www.johndcook.com/standard_deviation.html показано, как вычислить среднее значение, дисперсию и стандартные отклонения. Существуют ли алгоритмы, в которых параметры модели линейной или логистической регрессии можно аналогичным...
В последнее время я работал с большими наборами данных и нашел много статей о потоковых методах. Назвать несколько: Follow-the-Regularized-Leader и зеркальный спуск: теоремы об эквивалентности и регуляризация L1 ( http://jmlr.org/proceedings/papers/v15/mcmahan11b/mcmahan11b.pdf ) Потоковое...
У меня есть небольшая проблема, которая заставляет меня волноваться. Я должен написать процедуру для онлайн-процесса приобретения многомерного временного ряда. На каждом временном интервале (например, 1 секунда) я получаю новую выборку, которая в основном представляет собой вектор с плавающей...
В настоящее время я читаю статью « Эффективное онлайн и пакетное обучение с использованием прямого и обратного разделения » Джона Дючи и Йорама Сингера. Я очень смущен использованием терминов «Онлайн» и «Пакетный режим». Я подумал: «Онлайн» означает, что мы обновляем весовые параметры после...
У меня есть массив из nnn реальных значений, который имеет среднее значение μoldμold\mu_{old} и стандартное отклонение σoldσold\sigma_{old} . Если элемент массива xixix_i заменяется другим элементом , то новое среднее значение будетxjxjx_j...
Общий вопрос Скажем, у нас есть потоковые данные , , ... . Мы хотим рекурсивно вычислить оценку максимального правдоподобия \ boldsymbol {\ theta} . То есть, вычислив \ hat {\ boldsymbol {\ theta}} _ {n-1} = \ underset {\ boldsymbol {\ theta} \ in \ mathbb {R} ^ p} {\ arg \ max} \ prod_ { i = 1} ^...
Допустим, у меня есть классификатор логистической регрессии. В обычном пакетном обучении я бы использовал термин регуляризатор, чтобы предотвратить переоснащение и сохранить вес небольшим. Я также нормализую и масштабирую свои функции. В режиме онлайн обучения я получаю непрерывный поток данных. Я...
Существуют хорошо известные онлайн-формулы для вычисления экспоненциально взвешенных скользящих средних и стандартных отклонений процесса . Для среднего,(xn)n=0,1,2,…(xn)n=0,1,2,…(x_n)_{n=0,1,2,\dots} μn=(1−α)μn−1+αxnμn=(1−α)μn−1+αxn\mu_n = (1-\alpha) \mu_{n-1} + \alpha x_n и для дисперсии...
Я несколько неофициально использовал термин «случай Хейвуда» для обозначения ситуаций, когда онлайновая итеративно обновляемая оценка «конечного ответа» дисперсии становилась отрицательной из-за проблем с числовой точностью. (Я использую вариант метода Уэлфорда для добавления данных и удаления...
Мне нужно вычислить квартили (Q1, медиана и Q3) в режиме реального времени на большом наборе данных без сохранения наблюдений. Сначала я попробовал алгоритм P-квадрата (Jain / Chlamtac), но меня это не удовлетворило (слишком частое использование процессора, и я не был уверен в точности, по крайней...
Это было вдохновлено эффективной линейной регрессией онлайн , которая мне показалась очень интересной. Существуют ли какие-либо тексты или ресурсы, посвященные крупномасштабным статистическим вычислениям, с помощью которых вычисления с наборами данных слишком велики, чтобы помещаться в оперативную...
Может ли кто-нибудь указать мне направление онлайнового (рекурсивного) алгоритма регуляризации Тихонова (регуляризованных наименьших квадратов)? В автономном режиме я вычисляю β^=(XTX+λI)−1XTYβ^=(XTX+λI)−1XTY\hat\beta=(X^TX+λI)^{−1}X^TY используя мой исходный набор данных, где λλλ находится с...
В последнее время я пытался узнать больше об онлайн-обучении (это абсолютно увлекательно!), И одна тема, которую я так и не смог понять, - как думать о выборе моделей в офлайновом и онлайн-контекстах. В частности, предположим , что мы тренируем классификатор в автономном режиме, на основе...
Я хочу реализовать постепенную гауссовскую регрессию процесса, используя скользящее окно над точками данных, которое приходит один за другим через поток. Пусть обозначает размерность входного пространства. Итак, каждая точка данных имеет количество элементов.dddxixix_iddd Пусть будет размером...
Каковы хорошие стратегии для выполнения регрессии гауссовского процесса, когда функция, которую я пытаюсь приблизить, изменяется во времени? Наивный подход, который приходит мне в голову, состоит в том, чтобы использовать только N самых последних точек данных для выполнения регрессии. Какие...
Я хочу обрабатывать автоматически сегментированные изображения микроскопии для обнаружения неисправных изображений и / или ошибочных сегментаций как части высокопроизводительного конвейера обработки изображений. Существует множество параметров, которые можно вычислить для каждого необработанного...
Предположим, у меня есть одна выборка частот из 4 возможных событий: Event1 - 5 E2 - 1 E3 - 0 E4 - 12 и у меня есть ожидаемые вероятности того, что мои события произойдут: p1 - 0.2 p2 - 0.1 p3 - 0.1 p4 - 0.6 С суммой наблюдаемых частот моих четырех событий (18) я могу рассчитать ожидаемые частоты...