Теперь я видел две программы сертификации в области науки о данных - одну из программ Джона Хопкинса, доступную на Coursera, и одну из Cloudera .
Я уверен, что есть и другие.
Набор классов Джона Хопкинса сфокусирован на R как на наборе инструментов, но охватывает ряд тем:
- R Программирование
- очистка и получение данных
- Анализ данных
- Воспроизводимые исследования
- Статистические выводы
- Модели регрессии
- Машинное обучение
- Разработка продуктов данных
- И то, что выглядит как проектная задача завершения, похожая на Data Science Challenge от Cloudera
Программа Cloudera выглядит поверхностно, но, похоже, отвечает на два важных вопроса - «Знаете ли вы инструменты», «Можете ли вы применить инструменты в реальном мире». Их программа состоит из:
- Введение в науку о данных
- Экзамен по науке о данных
- Задача Data Science (реальный сценарий проекта Data Science)
Я не ищу рекомендации по программе или сравнения качества.
Мне любопытно узнать о других сертификациях, темах, которые они освещают, и о том, насколько серьезно сообщество оценивает сертификаты DS.
РЕДАКТИРОВАТЬ: Это все отличные ответы. Я выбираю правильный ответ по голосам.
Ответы:
Я сделал первые 2 курса, и я планирую сделать все остальные тоже. Если вы не знаете R, это действительно хорошая программа. Есть задания и викторины каждую неделю. Многие люди находят некоторые курсы очень сложными. Вам будет трудно, если у вас нет опыта программирования (даже если они говорят, что это не обязательно).
Просто помните .. это не потому, что вы можете водить машину, что вы пилот F1;)
источник
Как бывший менеджер по аналитике и ведущий научный сотрудник, я очень подозреваю в необходимости сертификатов по науке о данных. Термин «ученый по данным» довольно расплывчат, а область науки о данных находится в зачаточном состоянии. Сертификаты подразумевают какой-то единый стандарт, которого просто нет в науке о данных, это все еще очень дикий запад.
Хотя сертификат, вероятно, не причинит вам вреда, я думаю, что ваше время будет лучше потрачено на развитие опыта, чтобы знать, когда использовать определенный подход, и глубины понимания, чтобы иметь возможность объяснить этот подход нетехнической аудитории.
источник
Упомянутые вами программы сертификации - это курсы начального уровня. Лично я думаю, что эти сертификаты показывают только настойчивость человека, и они могут быть полезны только тем, кто подает заявку на стажировку, а не реальным работам по науке о данных.
источник
Я возглавляю команды по науке данных для крупной интернет-компании, и я просмотрел сотни анкет и опросил десятки для наших команд по всему миру. Многие кандидаты прошли вышеупомянутые курсы и программы или имеют аналогичные полномочия. Лично я также прошел курсы, некоторые из них хорошие, другие разочаровывают, но ни один из них не делает вас «специалистом по данным».
В общем, я согласен с остальными здесь. Сертификат от Coursera или Cloudera просто сигнализирует об интересе, но не двигает иглой. Есть еще много вопросов для рассмотрения, и вы можете оказать большее влияние, предоставив полный репозиторий своей работы (например, профиль github) и установив контакты с другими учеными в области данных. Любой, кто нанимает профиль науки о данных, всегда предпочитает видеть вашу предыдущую работу и стиль / способности кодирования.
источник
Существует несколько сертификаций, но они имеют разную направленность и стиль преподавания.
Я предпочитаю The Analytics Edge на eDX гораздо больше, чем специализацию Джона Хопкинса, поскольку она более интенсивна и практична. Ожидается, что в специализации Джона Хопкинса будет 3–4 часа в неделю против 11–12 часов в неделю на Analytics Edge.
С точки зрения отрасли, я воспринимаю эти сертификаты как знак интереса, а не уровень знаний, которыми обладает человек. В этих MOOC слишком много выбывших. Я ценю другой опыт (например, участие в соревнованиях Kaggle) гораздо больше, чем прохождение сертификации XYZ на MOOC.
источник
Не уверен насчет первой эры облаков, но один из моих друзей присоединился к Джону Хопкинсу, и, по его словам, это «здорово, чтобы вы начали». Это также было рекомендовано многими людьми. Я планирую присоединиться к нему через несколько недель. Что касается серьезности, я не думаю, что эти сертификаты помогут вам устроиться на работу, но они наверняка помогут вам учиться.
источник
@OP: Выбор ответов голосованием - САМАЯ ГЛАВНАЯ идея.
Ваш вопрос становится конкурсом популярности. Вы должны искать правильный ответ, я сомневаюсь, что вы знаете, что вы спрашиваете, знаете, что вы ищете.
Чтобы ответить на ваш вопрос: В
: насколько серьезно сообщество рассматривает сертификаты DS.
A: Какова ваша цель пройти эти курсы? Для работы, для школы, для самосовершенствования и т. Д.? Курсы Coursera очень полезны, вы не будете изучать теорию, они намеренно зарезервированы для установки в классе.
Тем не менее, курсы Coursera очень полезны. Я бы сказал, что это эквивалентно одному классу годового обучения по двухлетней программе магистратуры.
Я еще не уверен в его признании в отрасли, потому что проблема в том, как вы на самом деле взяли курс? Сколько времени вы провели? На этих курсах намного легче получить оценку «А», чем на экзамене на бумаге. Таким образом, будет существенное изменение качества от человека к человеку.
источник
Я думаю, что эффект сертификации от Coursera зависит от человека, а также классов. Требование гласит: минимум 3-5 часов в неделю, если вы вкладываете больше материала, а материал открывается дольше, чем на 3-5 часов, тогда эти классы и сертификаты могут быть эквивалентны обширной базе знаний и опыту в этой области. , Наука приходит к тем, кто этого требует.
источник
Я почти закончил со специализацией в области наук о данных Джона Хопкинса на Coursera (курс и контрольный камень оставлены для получения диплома). Я просто дам вам плюсы и минусы этого, стараясь сделать его максимально объективным:
Плюсы :
Минусы :
источник
Лучший способ добиться успеха в том, чтобы получить работу, которую вы хотите, чтобы показать, что вы можете это сделать.
Упомянутые вами MOOC дадут вам хорошее представление об основах, и их должно быть достаточно, чтобы вы начали решать собственные проблемы машинного обучения / науки о данных. Попробуйте один или два конкурса Kaggle, это отличный способ улучшить свои навыки, и приличная оценка будет интересна потенциальному работодателю. Опубликуйте свои результаты на Github, используя что-то вроде iPython Notebook, что позволит легко увидеть и оценить вашу работу.
Попробуйте провести анализ других общедоступных наборов данных, таких как набор данных UCI Bike Sharing или набор данных UCI Diabetes Treatment, которые очень интересно попробовать, и покажите, что вы заинтересованы и готовы развивать свои навыки.
источник
Это действительно зависит от авторитета учреждения, предоставляющего сертификат. Например, сертификация Data Science от компании, базирующейся в Гарварде, признана многими отраслевыми партнерами и может сделать хороший выбор. Вы не сказали, какой сертификат вы ищете?
источник
Значение для студента, смешанная сумка. Платить несколько сотен долларов за программу или сто поп за курс - это мотиватор.
Я закончил одну серию из MITx. Это курс для выпускников, посвященный методам и инструментам, предназначенным для тех, кому необходимо «знать» некоторые детали. Этого достаточно, чтобы мне было удобно применять то, что я узнал.
Автономный курс HarvardX по методу направленного ациклического графа больше походил на аспирантуру по статистике по методу Иудеи Перл. В противном случае я бы давно не услышал об этом.
Серия HarvardX - это учебный лагерь для выпускников, предназначенный для ориентации нового ученика на набор инструментов и приложений R.
Серия BerkeleyX - это курс опроса для студентов, использующий специализированный класс Python, который является почти языком, специфичным для предметной области.
Что касается стоимости сертификатов, я могу только сообщить, что мой единственный связанный образовательный опыт был магистром по геофизике, и у меня было около года оплачиваемого опыта работы вне моей должностной инструкции (старший юрист банка).
Возможно, из-за сертификатов мне было отказано в «переоценке» по крайней мере на двух работах, о которых я знаю. Итак, мой совет: если у вас есть сертификат, не упоминайте его, если при публикации вакансии появляется слово «Excel».
источник
Некоторые ресурсы по edX для курсов по науке о данных от Гарварда, Массачусетского технологического института, Microsoft и другие, которые могут представлять интерес для этой группы.
Например, у нас есть профессиональная программа сертификата от Гарварда , состоящей из 8 курсов и дипломный экзамен здесь .
Для более продвинутых исследований, у нас есть программа MicroMasters из MIT здесь .
а также один из Калифорнийского университета в Сан-Диего здесь . Для большого обзора Data Science у нас есть программа от Microsoft. Для всех наших программ вы можете проверить здесь .
Надеюсь это поможет,
Джош из edX
источник