Идеи проекта Data Science [закрыто]

23

Я не знаю, является ли это правильным местом для того, чтобы задать этот вопрос, но сообщество, посвященное Data Science, должно быть наиболее подходящим местом, по моему мнению.

Я только начал с Data Science и машинного обучения. Я ищу долгосрочные идеи проекта, над которыми я могу работать как 8 месяцев.

Сочетание науки о данных и машинного обучения было бы здорово.

Проект, достаточно большой, чтобы помочь мне понять основные концепции и одновременно реализовать их, был бы очень полезным.

Кевин Десаи
источник

Ответы:

27

Я бы попытался проанализировать и решить одну или несколько проблем, опубликованных на соревнованиях Kaggle ( https://www.kaggle.com/competitions ). Обратите внимание, что соревнования сгруппированы по их ожидаемой сложности , от 101(внизу списка) до Researchи Featured(вверху списка). Вертикальная полоса с цветовой кодировкой - это визуальное руководство для группировки. Вы можете оценить время, которое вы могли бы потратить на проект, скорректировав ожидаемую продолжительность соответствующего соревнования, основываясь на ваших навыках и опыте .

Ряд идей проекта по науке о данных можно найти на следующей Coursolveвеб-странице: https://www.coursolve.org/browse-needs?query=Data%20Science .

Если у вас есть навыки и желание работать над реальным научным проектом данных , ориентированным на социальные последствия , посетите DataKindстраницу проектов: http://www.datakind.org/projects . Другие проекты с акцентом на социальное воздействие можно найти на Data Science for Social Goodвеб-странице стипендии: http://dssg.io/projects .

Страница идей научного проекта на My NASA Dataсайте выглядит как еще одно место для посещения: http://mynasadata.larc.nasa.gov/804-2 .

Если вы хотите использовать открытые данные , этот длинный список приложений Data.govможет предоставить вам несколько интересных идей для проектов по науке о данных : http://www.data.gov/applications .

Александр Блех
источник
5

Возьми что-нибудь из своей повседневной жизни. Создайте предсказатель пробок в вашем регионе, создайте персонализированный музыкальный рекомендатель, проанализируйте автомобильный рынок и т. Д. Выберите реальную проблему, которую вы хотите решить - это не только сохранит вашу мотивацию, но и заставит вас пройти весь цикл разработки от сбора данных для проверки гипотез.

ffriend
источник
2
Получение данных часто является одной из самых сложных задач :)
Патлаф
2

Курс « Введение в Data Science» , который проводится на Coursera, теперь включает в себя проектные задания, в которых компании публикуют свои проблемы, и студентам предлагается их решить. Это делается через coursolve.com (уже упоминалось здесь).

Больше информации здесь (вы должны быть зачислены на курс, чтобы увидеть эту ссылку)

Алексей Григорьев
источник