Я инженер по компьютерным наукам, не обладаю знаниями в области статистики или математики.
Я изучаю книгу « Машинное обучение Python» Рашки и Миржалили, но когда я попытался понять математику машинного обучения, я не смог понять замечательную книгу, которую мой друг предлагает мне «Элементы статистического обучения» .
Знаете ли вы какие-нибудь более простые статистические и математические книги для машинного обучения? Если нет, как мне двигаться?
Ответы:
Хотя вам нужна книга, я рекомендую следующие курсы соответственно для понимания статистики, которая используется для машинного обучения и других задач в науке о данных. Они бесплатны.
Если я хочу порекомендовать книгу, я бы порекомендовал следующую книгу, которая распространяется бесплатно по лицензии CC . У этого есть хорошие примеры и это очень практично; кроме того, в нем много кодов, которые помогут вам почувствовать статистику в реальных примерах.
Подумайте Python Аллен Б. Дауни
Python Data Science Handbook
Также может помочь следующая ссылка:
источник
Введение в линейную алгебру https://math.mit.edu/~gs/linearalgebra/ является хорошей отправной точкой. Убедитесь, что вы хорошо разбираетесь в теории вероятностей, линейной алгебре и статистике. Глубокие знания могут быть необязательными, но для этого необходимы хорошие знания.
источник
Перед тем, как поступить в магистратуру по аналитике, мои пожилые предложили мне пройтись по этим двум книгам, чтобы узнать больше о машинном обучении и статистике.
А именно:
Если вы не можете найти эти книги в Интернете, дайте мне знать, поделитесь ссылкой, они у меня на диске. Эти книги помогли мне понять основы статистики с примерами, объясненными в терминах непрофессионала.
Если вы ищете некоторые онлайн-курсы, дайте мне знать, может предложить вам несколько хороших курсов (большинство из них бесплатны).
источник
По твоему вопросу я не могу сказать, насколько хорошо ты разбираешься в математике или где останавливается твое обучение. Я предполагаю, что, поскольку вы инженер по программному обеспечению, вы знакомы с алгеброй, геометрией и, возможно, с некоторыми исчислениями.
Я бы порекомендовал вам начать обучение с изучения статистики и понимания таких понятий, как описания, анализ данных, корреляция, распределение и так далее. Я вижу, что вы предпочитаете книги, а не видео, поэтому я буду встречаться с вами на полпути и предоставлю вам несколько книг, которые есть в Интернете, а также одну или две книги, которые вы можете купить в печатном виде.
Во-первых, я бы порекомендовал учебную программу онлайн-курса Penn State по статистике . Вы можете изучить каждый из их курсов, используя меню слева. Как только вы выберете курс, прокрутите вниз на веб-странице курса и нажмите на ссылку, которая гласит «онлайн заметки курса». Примечания к курсам для этих курсов гораздо больше, чем примечания и читаются как полные книги. Они очень поучительны. Кроме того, ознакомьтесь с учебной программой онлайн-курса для студентов Penn State по статистике , если вы найдете в выпускной работе что-то слишком сложное и хотите получить «более простое» объяснение.
Во-вторых, просмотрите Справочник по биологической статистике Джона Х. Макдональда. Не позволяйте названию обмануть вас; Эта книга является отличным учебником по статистике и анализу данных, применимым к любой области.
В-третьих, просмотрите «Небольшой справочник статистики » Джерарда Даллала. Опять же, не позволяйте названию обмануть вас; Эта книга - еще одна жемчужина, которая проведет вас через некоторые важные основы статистики.
В-четвертых, прочитайте книгу Аллена Дауни « Think Stats ». В Интернете есть бесплатная версия более ранней версии; самое последнее издание, которое вам придется купить. Хотя это того стоит, особенно если вы работаете в Python. В этой книге автор обучает вас статистике и анализу данных с использованием Python для анализа реальных (игрушечных) наборов данных. Это действительно отличная книга для проработки.
Наконец, ознакомьтесь с Data Science from Scratch от Джоэля Груса. Эта книга больше фокусируется на анализе данных (а не на основах статистики) и уделяет больше внимания машинному обучению и моделированию. Он использует Python (и стек данных Python), чтобы помочь вам проанализировать и провести прогнозную аналитику в реальных (игрушечных) наборах данных. Еще одна замечательная книга для проработки.
источник
Имейте в виду, что пока у меня есть степень магистра прикладной статистики, я собираюсь дать вам очень простой ответ: пройти курс по вероятностям.
Большинство современных сред программирования ML берут большую часть математики из науки о данных; Вы действительно просто не будете нуждаться в этом в большинстве сценариев. Но вам всегда потребуется способность понимать свои результаты, и большинство результатов выражается в вероятностях. Если бы я был новичком в науке о данных, я бы прошел (краткий) курс по вероятностям, попытался бы понять, что на самом деле означают пропорции и проценты, а затем я бы действительно очень хорошо знал основы (такие как Tensorflow). Если вы можете сделать это, вы можете написать несколько действительно интересных алгоритмов, и вам не нужно быть одержимым математикой.
источник