Начинающие математические книги для машинного обучения

14

Я инженер по компьютерным наукам, не обладаю знаниями в области статистики или математики.

Я изучаю книгу « Машинное обучение Python» Рашки и Миржалили, но когда я попытался понять математику машинного обучения, я не смог понять замечательную книгу, которую мой друг предлагает мне «Элементы статистического обучения» .

Знаете ли вы какие-нибудь более простые статистические и математические книги для машинного обучения? Если нет, как мне двигаться?

Tantaros
источник
У меня есть диплом бакалавра в области статистики, и в настоящее время я учусь на магистратуре в Data Science с Simplilearn ... чтобы быть специалистом по данным, нужно иметь большой опыт в области статистики ... потому что большинство моделей в машинном обучении основано на математике и математике. Статистика, которая преподается на уровне степени или лучше ... мой совет - прочитать справочник по науке о данных с помощью python ... отправьте мне электронное письмо по адресу pchiita@gmail.com ... чтобы я мог поделиться своими материалами на своем диске Google. .. у меня много хороших книг ... счастливого обучения ....
Пол Чиита

Ответы:

8

Хотя вам нужна книга, я рекомендую следующие курсы соответственно для понимания статистики, которая используется для машинного обучения и других задач в науке о данных. Они бесплатны.

Если я хочу порекомендовать книгу, я бы порекомендовал следующую книгу, которая распространяется бесплатно по лицензии CC . У этого есть хорошие примеры и это очень практично; кроме того, в нем много кодов, которые помогут вам почувствовать статистику в реальных примерах.

Также может помочь следующая ссылка:

СМИ
источник
Спасибо за ответ. Но я предпочитаю книги, у вас есть предложения?
Тантарос
@Tantaros Я обновил ответ
СМИ
Добавлена ​​еще одна ссылка ..
Адитья
как насчет линейной алгебры, исчисления и т. д.? Я не занимался математикой со средней школы, так что я в основном начинаю с нуля. однако, я программировал некоторое время. Есть ли недавний список различных типов математики, которые мне нужны для ML в 2018/2019? спасибо
старик
Конечно, есть специализация. Я не помню его точное название. У него есть три курса, и это то, что вам нужно. Это математика для мл.
СМИ
2

Введение в линейную алгебру https://math.mit.edu/~gs/linearalgebra/ является хорошей отправной точкой. Убедитесь, что вы хорошо разбираетесь в теории вероятностей, линейной алгебре и статистике. Глубокие знания могут быть необязательными, но для этого необходимы хорошие знания.

Сандип Кумар
источник
я где-то слышал, что нужно знать линейную алгебру, а также исчисление? Это правда? все, что я хочу знать, это то, какие виды математики абсолютно необходимы для понимания математики машинного обучения в 2018/2019! любая помощь будет принята с благодарностью!
старик
2

Перед тем, как поступить в магистратуру по аналитике, мои пожилые предложили мне пройтись по этим двум книгам, чтобы узнать больше о машинном обучении и статистике.

А именно:

  1. Обнаружение статистики с SPSS / R - Энди Филд
  2. R Beginner и R для всех
  3. Прогнозирующая аналитика - способность предсказать, кто нажмет, купит, обманет или умрет
  4. Наука о данных для бизнеса и многое другое

Если вы не можете найти эти книги в Интернете, дайте мне знать, поделитесь ссылкой, они у меня на диске. Эти книги помогли мне понять основы статистики с примерами, объясненными в терминах непрофессионала.

Если вы ищете некоторые онлайн-курсы, дайте мне знать, может предложить вам несколько хороших курсов (большинство из них бесплатны).

оборота Торос91
источник
1
Большинство книг с R или любым другим инструментом не решат его проблему.
Дксахуджи
1
на самом деле причина, по которой я предложил ему эту книгу, состоит в том, что примеры очень хороши и легко понятны, и случайно они были объяснены в R, но у R для всех есть объяснение о реализации и т. д.
Toros91
@ Toros91 не могли бы вы предоставить ссылки? Я думаю, что их стоит упомянуть :)
СМИ
1
@Media взгляните на одну из моих небольших коллекций (сейчас не поддерживается) ( 1drv.ms/f/s!AhfWNelcf3iAgm5t4luUhUFal8II )
Aditya
@ Aditya уверен :)
Медиа
1

По твоему вопросу я не могу сказать, насколько хорошо ты разбираешься в математике или где останавливается твое обучение. Я предполагаю, что, поскольку вы инженер по программному обеспечению, вы знакомы с алгеброй, геометрией и, возможно, с некоторыми исчислениями.

Я бы порекомендовал вам начать обучение с изучения статистики и понимания таких понятий, как описания, анализ данных, корреляция, распределение и так далее. Я вижу, что вы предпочитаете книги, а не видео, поэтому я буду встречаться с вами на полпути и предоставлю вам несколько книг, которые есть в Интернете, а также одну или две книги, которые вы можете купить в печатном виде.

Во-первых, я бы порекомендовал учебную программу онлайн-курса Penn State по статистике . Вы можете изучить каждый из их курсов, используя меню слева. Как только вы выберете курс, прокрутите вниз на веб-странице курса и нажмите на ссылку, которая гласит «онлайн заметки курса». Примечания к курсам для этих курсов гораздо больше, чем примечания и читаются как полные книги. Они очень поучительны. Кроме того, ознакомьтесь с учебной программой онлайн-курса для студентов Penn State по статистике , если вы найдете в выпускной работе что-то слишком сложное и хотите получить «более простое» объяснение.

Во-вторых, просмотрите Справочник по биологической статистике Джона Х. Макдональда. Не позволяйте названию обмануть вас; Эта книга является отличным учебником по статистике и анализу данных, применимым к любой области.

В-третьих, просмотрите «Небольшой справочник статистики » Джерарда Даллала. Опять же, не позволяйте названию обмануть вас; Эта книга - еще одна жемчужина, которая проведет вас через некоторые важные основы статистики.

В-четвертых, прочитайте книгу Аллена Дауни « Think Stats ». В Интернете есть бесплатная версия более ранней версии; самое последнее издание, которое вам придется купить. Хотя это того стоит, особенно если вы работаете в Python. В этой книге автор обучает вас статистике и анализу данных с использованием Python для анализа реальных (игрушечных) наборов данных. Это действительно отличная книга для проработки.

Наконец, ознакомьтесь с Data Science from Scratch от Джоэля Груса. Эта книга больше фокусируется на анализе данных (а не на основах статистики) и уделяет больше внимания машинному обучению и моделированию. Он использует Python (и стек данных Python), чтобы помочь вам проанализировать и провести прогнозную аналитику в реальных (игрушечных) наборах данных. Еще одна замечательная книга для проработки.

Кит Дауд
источник
1

Имейте в виду, что пока у меня есть степень магистра прикладной статистики, я собираюсь дать вам очень простой ответ: пройти курс по вероятностям.

Большинство современных сред программирования ML берут большую часть математики из науки о данных; Вы действительно просто не будете нуждаться в этом в большинстве сценариев. Но вам всегда потребуется способность понимать свои результаты, и большинство результатов выражается в вероятностях. Если бы я был новичком в науке о данных, я бы прошел (краткий) курс по вероятностям, попытался бы понять, что на самом деле означают пропорции и проценты, а затем я бы действительно очень хорошо знал основы (такие как Tensorflow). Если вы можете сделать это, вы можете написать несколько действительно интересных алгоритмов, и вам не нужно быть одержимым математикой.

I_Play_With_Data
источник