Введение в машинное обучение для математиков

23

В каком-то смысле это мой перекрестный пост от math.stackexchange , и у меня есть ощущение, что этот сайт может обеспечить широкую аудиторию.

Я ищу математическое введение в машинное обучение. В частности, много литературы, которая может быть найдена, является относительно неточной, и многие страницы тратятся без какого-либо содержания.

Однако, исходя из такой литературы, я обнаружил курсы Coursera от Эндрю Нга, книгу епископа по распознаванию образов и, наконец, книгу Смолы. К сожалению, книга Смола находится только в черновом состоянии. В книге Смолы можно найти даже доказательства, которые мне нравятся. Книга Бишопа уже довольно хороша, но определенное количество строгости отсутствует.

Короче говоря: я ищу книгу, подобную книге Смолы, то есть максимально точную и строгую и использующую математический фон (хотя короткие вступления, конечно, в порядке).

Любые рекомендации?

Quickbeam2k1
источник
1
В будущем, пожалуйста, не кросспост.
Momo
Похоже, что вопрос еще не закончен - он прерывается после «и».
JW
извините, моя редакция исчезла.
Quickbeam2k1
1
Возможно, вы захотите объяснить, почему математик хочет узнать о машинном обучении (чтобы найти работу в качестве ученого по данным / проводить исследования / и т. д.), который поможет людям направить вас в правильном направлении
seanv507
1
для науки о данных я бы сказал, что вам нужно базовое понимание статистики (например, линейная / логистическая регрессия), дизайн эксперимента, например, ab-тестирование и т. д., а также понимание методов рекомендующей системы
seanv507

Ответы:

9

Для того, что вы описываете, я настоятельно рекомендую «Основы машинного обучения» от Mohri et.al. Это текст для студентов, но для действительно хороших студентов. Это читабельное и это единственное место, где я нашел то, что я бы назвал математическим определением машинного обучения (pac и слабый pac). Стоит прочитать только по этой причине. У меня также есть доктор математических наук. Я знаком со многими книгами, упомянутыми выше. Я особенно люблю ESL для широкого спектра методов и идей, но это статистическая книга с большим количеством математики.

Мех
источник
1
Кстати, мне сказали, что Шапире в своей диссертации доказал, что слабый PAC подразумевает PAC. Его доказательство сводится к технике повышения, так что это хороший пример того, как теоретический вопрос привел к очень практическому результату.
Мех
Спасибо за ваши замечания. Я думаю, что я буду работать с ESL позже, после работы с книгами Мори и Шалева-Шварца
Quickbeam2k1
12

Я бы порекомендовал элементы статистического обучения (бесплатный файл PDF). В нем достаточно математики и хорошее введение во все соответствующие методы - вместе с некоторыми соображениями о том, почему эти методы работают (а когда нет).

Также введение в статистическое обучение (что более практично - как это сделать в R ). У этого есть курс, бегущий статистическое изучение ; Вы можете найти лекции на YouTube (и снова бесплатный PDF).

seanv507
источник
3
Это очень хорошая рекомендация. В дополнение к этому я предлагаю «Изучение данных» от Ясера С. Абу-Мостафы. Это в значительной степени теоретический, но очень четко объясняет такие темы, как выполнимость обучения и измерение VC. Видео и слайды доступны онлайн .
tiagotvv
Второе предложение «Изучение данных» от Ясера С. Абу-Мостафы. Книга очень короткая, но наполнена ценной информацией. Большое внимание действительно уделяется возможности обучения и сложности.
Владислав Довгальец
7

Вам, вероятно, понравятся « Изучение с ядрами » Шёлкопфа и Смолы. Большая часть работ Шёлкопфа математически строгая.

Тем не менее, вы, вероятно, лучше читать научные статьи, а не учебники. Исследовательские работы содержат полные выводы и доказательства сходимости, оценки производительности и т. Д., Которые очень часто не включаются в учебники. Хорошее место для начала - журнал машинного обучения , который высоко ценится и является полностью открытым. Я также рекомендую материалы конференций, таких как ICML , NIPS , COLT и IJCNN .

Peter Mortensen
источник
спасибо за подсказки с журналом. Однако я боюсь, что журналы пока слишком развиты для меня. Тем не менее, эта миграция станет ценным источником для будущего.
Quickbeam2k1