Что стоит за Google Prediction API?

Google Prediction API - это облачный сервис, в котором пользователь может отправить некоторые обучающие данные для обучения таинственному классификатору, а затем попросить его классифицировать входящие данные, например, для реализации спам-фильтров или прогнозирования пользовательских предпочтений.

Но что за кадром?

machine-learning
источник

Я подозреваю, что они надеются сохранить это коммерчески конфиденциально!

OneStop

Это может быть правдой, но видео (с лета 2010 года) показывает, что к тому времени они еще экспериментировали; поэтому я опубликовал этот вопрос, надеясь, что с тех пор появились некоторые утечки.

Существует «несколько» алгоритмов, которые Prediction API может выбирать при обучении / прогнозировании ваших данных. Двигатель выбирает тот, который он считает лучшим. Некоторые пользователи просили немного больше контроля над этим выбором, goo.gl/mod/5EoA , даже если алгоритм неизвестен. Реддиторы спекулируют на смелости здесь, reddit.com/r/MachineLearning/comments/evdxb/… , но выступление по статистике потеряно для меня.

HyperSlug

@hyperslug Опубликуйте это как ответ, это очень полезно, поэтому я хотел бы принять это.

Ответы:

Google использует различные методы и алгоритмы машинного обучения для обучения и прогнозирования. Стратегии крупномасштабного контролируемого обучения: 1. Подвыборка 2. Неловко распараллеливать некоторые алгоритмы 3. Распределенный градиентный спуск 4. Голосование большинством 5. Смешение параметров 6. Сочетание итерационных параметров

Они должны обучать и прогнозировать модель с помощью различных методов машинного обучения и использования алгоритма для определения наилучшей модели и прогнозирования для возвращения.

Подвыборка обеспечивает низкую производительность
Смесь параметров улучшается, но не так хорошо, как все данные
Распределенные алгоритмы возвращают лучшие классификаторы быстрее
Итеративное смешение параметров достигает такого же уровня, как и все данные

Но, конечно, это не совсем понятно в документации API.

404Dreamer_ML
источник