Кулинарная книга по машинному обучению / справочная карточка / шпаргалка?

57

Я считаю невероятно полезными такие ресурсы, как Книга вероятностей и статистики и Справочная карта R для интеллектуального анализа данных . Они, очевидно, служат справочной информацией, но также помогают мне организовать свои мысли по теме и получить представление о земле.

В: Есть ли что-то подобное этим ресурсам для методов машинного обучения?

Я представляю себе справочную карточку, которая для каждого метода ML будет включать:

  • Общие свойства
  • Когда метод работает хорошо
  • Когда метод работает плохо
  • Из каких или каких других методов метод обобщается. Это было в основном заменено?
  • Основополагающие документы по методу
  • Открытые проблемы, связанные с методом
  • Вычислительная интенсивность

Я уверен, что все эти вещи можно найти с минимальным копанием в учебниках. Было бы очень удобно иметь их на нескольких страницах.

lowndrul
источник
5
Хорошая цель, но "минимальное копание в некоторых учебниках"? Как можно даже начать сжимать эти 20 книг для статистического обучения и интеллектуального анализа данных + mloss.org/software/rating ?
Денис
2
еще один: stats.stackexchange.com/questions/19311/…
steffen
2
(+1) для chuzpa, если бы такой обзор существовал, я бы заплатил за него. Ключевая проблема заключается в том, что помимо некоторых свойств, которые могут быть получены из самого алгоритма, большинство таких свойств или практических правил приобретается на основе опыта, то есть применения. Я уверен, что закоренелый в боях прикладной исследователь или программист / консультант по ML-фреймворкам мог написать что-то подобное ... но здесь и сейчас?
Штеффен
@Denis: ссылка "20 книг .." не работает, вы можете проверить это?
lmsasu
6
Я не специалист по машинному обучению, поэтому я буду откладывать на пост других ответы, но я думаю, что «Элементы статистического обучения» считаются хорошим текстом по этому предмету и написаны одними из самых значительных имен в этой области. Я должен добавить, что эта книга написана на высоком уровне, и те, кого я слышал, рекомендуют иметь докторскую степень в области статистики.
Макрос

Ответы:

25

Некоторые из лучших и свободно доступных ресурсов:

Что касается вопроса автора, я не встречал решение «Все на одной странице»

Сергей
источник
Сергей, книга Барбера связана с Матлабом?
Денис
2
Да, просто взгляните на ссылку книги: окно BRMLtool предназначено для того, чтобы помочь читателям увидеть, как математические модели преобразуются в реальный код MAT-LAB.
Сергей
31

Если вы хотите изучать машинное обучение, я настоятельно рекомендую вам записаться на бесплатный онлайн-курс по зимнему ML, который проводит профессор Эндрю Нг .

Я сделал предыдущий осенью, и все учебные материалы имеют исключительное качество и ориентированы на практическое применение, и гораздо легче справиться с этой борьбой наедине с книгой.

Это также сделало довольно низко висящий фрукт с хорошими интуитивными объяснениями и минимальным количеством математики.

clyfe
источник
Я только что закончил этот курс, и он потрясающий! Кроме того, это дало мне хорошее начало для понимания книг по машинному обучению.
B Семь
1
Я думаю, что эта ссылка сейчас - coursera.org/course/ml
n611x007,
14

Да, ты в порядке; «Распознавание образов и машинное обучение» Кристофера Бишопа - отличная книга для общего ознакомления, с ней нельзя ошибиться.

Относительно недавняя книга, но также очень хорошо написанная и столь же обширная, - « Байесовское мышление и машинное обучение » Дэвида Барбера ; книга, которую я чувствую, немного больше подходит новичку в этой области.

Я использовал «Элементы статистического обучения» от Hastie et al. (упомянуто Макро), и хотя это очень сильная книга, я бы не рекомендовал ее в качестве первой ссылки; может быть, это послужит вам лучшим справочным материалом для более специализированных тем. В этом аспекте книга Дэвида Маккея « Теория информации, умозаключения и алгоритмы обучения» также может сделать великолепную работу.

usεr11852 говорит восстановить Monic
источник
2
+1 для епископа. Четкое развитие с ровным уровнем детализации. Хотя все еще хорошо, я всегда находил Hastie et al. немного изменчивый
conjugateprior
1
+1 - Хасти, Тибширани и Фридман - мой личный фаворит.
StasK
1
+1 тоже за рекомендацию Хасти, Тибширани и Фридмана, моего личного фаворита. И спасибо за другие рекомендации; Я прочитаю их, потому что мне действительно нужна хорошая книга, чтобы порекомендовать не статистику (или людям, которые только выходят на поле).
Нестор
1
+1 для епископа. Это на самом деле отличный источник для классической статистики, но обновленный и скрытый.
предположения
10

Поскольку, как представляется, все согласны с тем, что этот вопрос не является дубликатом, я хотел бы поделиться своим фаворитом для начинающих машиностроителей:

Я нашел Программирование Коллективного Разума самой простой книгой для начинающих, так как автор Тоби Сегаран сосредоточен на том, чтобы позволить среднему разработчику программного обеспечения максимально быстро испачкать свои руки взломом данных.

Типичная глава: проблема с данными четко описана, после чего следует грубое объяснение того, как работает алгоритм, и, наконец, показано, как создать некоторые идеи с помощью всего лишь нескольких строк кода.

Использование python позволяет достаточно быстро все понять (вам не нужно знать python, серьезно, я тоже раньше не знал). Не думайте, что эта книга сосредоточена только на создании рекомендательной системы. Он также занимается анализом текста / фильтрацией спама / оптимизацией / кластеризацией / проверкой и т. Д. И, следовательно, дает вам четкий обзор основных инструментов каждого майнера данных.

Штеффен
источник
6

Виттен и Фрэнк, «Data Mining», Elsevier 2005 - хорошая книга для самообучения, поскольку в ней есть библиотека кода Java (Weka), и она очень ориентирована на практическое применение. Я подозреваю, что есть более свежее издание, чем то, которое у меня есть.

Дикран Сумчатый
источник
1
Да, эта книга должна была называться «Машинное обучение», но издатели изменили название на «Интеллектуальный анализ данных», чтобы в то время использовать шумиху в области интеллектуального анализа данных, тем не менее книга о ML, а не DM (два сходства, но это разные поля!).
Клиф
1
Книга Тома Митчелла «Машинное обучение» также очень хороша; стиль немного старомоден, но содержание превосходно.
Дикран Сумчатый
Да, ML Тома Митчелла похож на Библию ML, действительно всеобъемлющую на поле!
clyfe
5

У меня есть машинное обучение: Алгоритмическая перспектива Стивена Марсленда, и я считаю его очень полезным для самообучения. Код Python приведен на протяжении всей книги.

Я согласен с тем, что сказано в этом благоприятном обзоре:

http://blog.rtwilson.com/review-machine-learning-an-algorithmic-perspective-by-stephen-marsland/

лощина
источник
5

«Элементы статистического обучения» будет отличной книгой для ваших целей. Пятое издание книги, которое было опубликовано в начале 2011 года, свободно доступно по адресу http://www.stanford.edu/~hastie/local.ftp/Springer/ESLII_print5.pdf.

DanB
источник
2
Это тяжелая книга по математике, поэтому для ученика может быть трудно следовать.
Атилла Озгур
Знаете ли вы, как его можно бесплатно загрузить на личных страницах Тревора Хасти, когда Springer берет за это 70 долларов?
Альфред М.
Я не знаю наверняка, но я бы предположил, что Springer хочет денег, и авторы в основном хотят широко публиковать свои книги. Это похоже на то, как Springer будет продавать вам опубликованные статьи, в то время как многие «рабочие версии» свободно доступны на веб-сайте автора.
ДанБ
FYI, загрузка на 5 - й печати второго издания. Я люблю сноску к эйпграфу «В Бога, которому мы верим, все другие приносят данные», который приписывается Демингу. Сноска указывает на иронию, что не может быть найдено никаких «данных», подтверждающих, что Деминг действительно говорит это.
HeatfanJohn
Вы должны упомянуть Введение в статистическое обучение с помощью R - это похоже на ESL -lite (если математика в ESL слишком устрашающая).
Стив С.
5

введите описание изображения здесь

Часто самой сложной частью решения проблемы машинного обучения может быть поиск подходящего оценщика для работы. Разные оценщики лучше подходят для разных типов данных и разных задач. Приведенная ниже блок-схема предназначена для того, чтобы дать пользователям немного приблизительное руководство о том, как подходить к проблемам, касающимся того, какие оценщики примерить ваши данные. Нажмите на любой оценщик в таблице ниже, чтобы увидеть его документацию.

Антон Тарасенко
источник
3

Большинство книг, упомянутых в других ответах, очень хороши, и вы не ошибетесь ни с одной из них. Кроме того, я нахожу следующую шпаргалку для Python scikit-learnвесьма полезной.

Марк Клазен
источник
2

Мне нравятся Дуда, Харт и Аист "Классификация узоров". Это недавний пересмотр классического текста, который все очень хорошо объясняет. Не уверен, что он обновлен, чтобы иметь большой охват нейронных сетей и SVM. Книга Хасти, Тибширани и Фридмана о лучшем из того, что есть, но может быть немного более технической, чем то, что вы ищете, и является подробным, а не обзором предмета.

Майкл Черник
источник
2

Microsoft Azure также предоставляет аналогичную шпаргалку к научному, опубликованному Антоном Тарасенко.

Шпаргалка по алгоритму машинного обучения Microsoft Azure

(источник: https://docs.microsoft.com/en-us/azure/machine-learning/machine-learning-algorithm-cheat-sheet )

Они сопровождают это с уведомлением:

Предложения, предложенные в этом листе алгоритма, являются приблизительными эмпирическими правилами. Некоторые могут быть согнуты, а некоторые могут быть грубо нарушены. Это предназначено, чтобы предложить отправную точку. (...)

Microsoft дополнительно предоставляет вводную статью, содержащую дополнительную информацию.

Обратите внимание, что эти материалы ориентированы на методы, реализованные в Microsoft Azure.

Тим
источник
1

Не начинайте с элементов статистического обучения. Это здорово, но это справочник, который не похож на то, что вы ищете. Я бы начал с программирования Коллективного разума, так как его легко читать.

Нил Макгиган
источник
Я не уверен, что охарактеризовал бы ESL как справочный текст. Это кажется мне большим обзором, т. Е. Вы не собираетесь изучать мельчайшие детали (вряд ли) чего-либо. Вы увидите широкие техники и всеобъемлющие темы.
кардинал
1

Для первой книги по машинному обучению, которая хорошо объясняет принципы, я настоятельно рекомендую

Роджерс и Джиролами, Первый курс по машинному обучению , (Chapman & Hall / CRC Машинное обучение и распознавание образов), 2011.

Книга Криса Бишопа или Дэвида Барбера оба сделают хороший выбор для книги с большей широтой, если вы хорошо разберетесь в принципах.

Дикран Сумчатый
источник
0

Я написал такое резюме, но только по одной задаче машинного обучения (Netflix Prize), и оно состоит из 195 страниц: http://arek-paterek.com/book

Арек Патерек
источник