Я бы попытался проанализировать и решить одну или несколько проблем, опубликованных на соревнованиях Kaggle ( https://www.kaggle.com/competitions ). Обратите внимание, что соревнования сгруппированы по их ожидаемой сложности , от 101
(внизу списка) до Research
и Featured
(вверху списка). Вертикальная полоса с цветовой кодировкой - это визуальное руководство для группировки. Вы можете оценить время, которое вы могли бы потратить на проект, скорректировав ожидаемую продолжительность соответствующего соревнования, основываясь на ваших навыках и опыте .
Ряд идей проекта по науке о данных можно найти на следующей Coursolve
веб-странице: https://www.coursolve.org/browse-needs?query=Data%20Science .
Если у вас есть навыки и желание работать над реальным научным проектом данных , ориентированным на социальные последствия , посетите DataKind
страницу проектов: http://www.datakind.org/projects . Другие проекты с акцентом на социальное воздействие можно найти на Data Science for Social Good
веб-странице стипендии: http://dssg.io/projects .
Страница идей научного проекта на My NASA Data
сайте выглядит как еще одно место для посещения: http://mynasadata.larc.nasa.gov/804-2 .
Если вы хотите использовать открытые данные , этот длинный список приложений Data.gov
может предоставить вам несколько интересных идей для проектов по науке о данных : http://www.data.gov/applications .
Курс « Введение в Data Science» , который проводится на Coursera, теперь включает в себя проектные задания, в которых компании публикуют свои проблемы, и студентам предлагается их решить. Это делается через coursolve.com (уже упоминалось здесь).
Больше информации здесь (вы должны быть зачислены на курс, чтобы увидеть эту ссылку)
источник