Будучи новичком в машинном обучении в целом, я хотел бы начать играть и посмотреть, каковы возможности.
Мне любопытно, какие приложения вы могли бы порекомендовать, чтобы предложить самое быстрое время от установки до получения значимого результата.
Кроме того, любые рекомендации для хороших материалов для начинающих по теме машинного обучения в целом будут оценены.
machine-learning
Стив Каллестад
источник
источник
Ответы:
Я бы рекомендовал начать с MOOC по машинному обучению. Например, курс Эндрю Нг в Coursera.
Вы также должны взглянуть на приложение Orange . Он имеет графический интерфейс, и, возможно, с его помощью легче понять некоторые методы ML.
источник
Если честно, я думаю, что выполнение некоторых проектов научит вас гораздо большему, чем полный курс. Одна из причин заключается в том, что выполнение проекта является более мотивирующим и открытым, чем выполнение заданий.
Конечно, если у вас есть время И мотивация (реальная мотивация), это лучше, чем делать проект. Другие комментаторы сделали хорошие рекомендации для платформы по технологии.
Я думаю, с веселой точки зрения проекта, вы должны задать вопрос и получить компьютер, чтобы научиться на него отвечать.
Вот некоторые хорошие классические вопросы, которые имеют хорошие примеры:
У этих проектов есть математика, код, и их можно легко найти в Google.
Другие интересные темы могут быть сделаны вами!
Наконец, я исследую робототехнику, поэтому для меня большинство приложений FUN - поведенческие. Примеры могут включать в себя (если вы можете играть с Arduino)
Создайте приложение, которое, возможно, использует логистическую регрессию, которое узнает, когда выключать и включать вентилятор с учетом внутренней температуры и состояния освещения в комнате.
Создайте приложение, которое обучает робота перемещать привод, возможно, колесо, на основе сенсорного ввода (возможно, нажатием кнопки), с использованием моделей гауссовой смеси (обучение на демонстрации).
Во всяком случае, они довольно продвинуты. Я хочу сказать, что если вы выберете проект, который вам (действительно) нравится, и потратите на него несколько недель, вы многому научитесь и поймете гораздо больше, чем получите, выполнив несколько заданий.
источник
Я думаю, что Weka - хорошая отправная точка. Вы можете делать кучу вещей, таких как контролируемое обучение или кластеризация, и легко сравнивать большой набор алгоритмов и методологий.
Руководство Weka - это книга по машинному обучению и интеллектуальному анализу данных, которую можно использовать в качестве вводного материала.
источник
Предполагая, что вы знакомы с программированием, я бы порекомендовал взглянуть на scikit-learn . Он имеет особенно хорошие справочные страницы, которые могут служить в качестве мини-уроков / краткого обзора по машинному обучению. Выберите интересную область и проработайте примеры.
источник
Я обнаружил, что курс « Введение в машинное обучение» очень полезен , поэтому начнем с него. Он использует библиотеку Encog для быстрого изучения различных методов мл.
источник
Если вы уже знакомы с R Studio, то пакет с кареткой - хорошее место для начала. Вот несколько уроков:
С помощью R и Caret вы можете легко загружать и объединять наборы данных, сокращать число функций, анализ главных компонентов, а также обучать и прогнозировать, используя различные алгоритмы.
источник
Если вы можете воспроизвести сетку графиков 6x3 со баннера на странице http://scikit-learn.org/, то вы выучите немного ML и немного Python. Вы не упомянули язык. Python достаточно прост для изучения очень быстро, а в scikit-learn реализован широкий спектр алгоритмов.
Тогда попробуй свои данные!
источник
В дополнение к опубликованным курсам и учебникам я хотел бы предложить кое-что более «практическое»: в Kaggle есть несколько вступительных конкурсов, которые могут заинтересовать вас (большинство людей начинают с конкурса «Титаник»). И есть большое разнообразие предметов для изучения и соревнования, когда вы хотите получить больше опыта.
источник
Как уже упоминалось выше, ответы постигают основы ML, следуя MOOC профессора Эндрю Нг и «Изучение данных» профессора Ясера Абу-Мостафы.
R - явный победитель как наиболее используемый инструмент в соревнованиях Kaggle. (Не забудьте проверить ресурсы на вики и форумах Kaggle)
Изучите основы R и Python. Трек Coursera «Data Science» имеет вводный курс R . Почти все алгоритмы можно найти в библиотеках Python и R. Не стесняйтесь использовать алгоритмы, которые вы выучили в нескольких соревнованиях по борьбе. В качестве отправной точки сравните производительность нескольких алгоритмов на наборе данных Titanic и наборе данных распознавателя Digit на kaggle .
И продолжайте практиковаться в различных наборах данных!
источник