Я знаю, что люди любят закрывать дубликаты, поэтому я не прошу ссылки для начала изучения статистики (как здесь ).
У меня есть докторская степень по математике, но я никогда не изучал статистику. Каков кратчайший путь к эквивалентным знаниям в высшей степени статистики БС и как мне измерить, когда я достиг этого.
Если список книг будет достаточным (предположим, что я выполняю упражнения, скажем так), это потрясающе. Да, я ожидаю, что решение проблем будет неявной частью изучения этого, но я хочу ускорить процесс настолько, насколько это возможно. Я не ищу безумно строгое обращение, если это не часть того, чему обычно учат статистические специалисты.
references
careers
Джон Робертсон
источник
источник
Ответы:
(Очень) рассказ
Короче говоря, в некотором смысле статистика похожа на любую другую техническую область: быстрого пути нет .
Длинная история
Программы бакалавриата по статистике в США относительно редки. Одна из причин, по которой я считаю это верным, заключается в том, что в учебную программу бакалавриата довольно сложно собрать все необходимое для изучения статистики. Это особенно верно в университетах, которые предъявляют значительные требования к общему образованию.
Развитие необходимых навыков (математических, вычислительных и интуитивно понятных) занимает много сил и времени. Статистику можно начать понимать на довольно приличном «операционном» уровне, когда студент освоит исчисление и приличное количество линейной и матричной алгебры. Тем не менее, любой специалист по прикладной статистике знает, что довольно легко найти себя на территории, которая не соответствует подходу к статистике, основанному на принципах печенья или на основе рецептов. Чтобы действительно понять, что происходит под поверхностью, необходимо в качестве предварительного условияматематическая и, в современном мире, вычислительная зрелость, которая реально достижима только в последние годы обучения в бакалавриате. Это одна из причин того, что настоящая статистическая подготовка в основном начинается на уровне MS в США (Индия, с их специализированным ISI, это немного другая история. Подобный аргумент может быть приведен для некоторого канадского образования. Я недостаточно знаком с Европейское или российское образование по статистике для студентов, чтобы иметь обоснованное мнение.)
Практически любая (интересная) работа потребует образования на уровне MS, а действительно интересные (на мой взгляд) рабочие места, по сути, требуют обучения на уровне докторантуры.
Поскольку у вас есть докторская степень по математике, хотя мы не знаем, в какой области, вот мои предложения относительно чего-то более близкого к образованию на уровне MS. Я включаю некоторые замечания в скобках, чтобы объяснить выбор.
Дополняет
Вот некоторые другие книги, в основном немного более продвинутые, теоретические и / или вспомогательные, которые полезны.
Более продвинутые (докторантура) тексты
Леманн и Казелла, Теория оценки точек . (На уровне доктора наук оценка баллов. Часть задачи этой книги - прочитать ее и выяснить, что является опечаткой, а что нет. Когда вы увидите, как быстро их узнаете, вы поймете, что понимаете. такого типа там, особенно если вы погрузитесь в проблемы.)
Леман и Романо, Проверка статистических гипотез . (Обработка гипотез на уровне PhD. Не так много опечаток, как TPE выше.)
А. ван дер Ваарт, Асимптотическая статистика . (Прекрасная книга по асимптотической теории статистики с хорошими подсказками по прикладным областям. Хотя это не прикладная книга. Единственное, что я могу сказать, это то, что используются довольно странные обозначения, а детали иногда вытираются щеткой.)
источник
Я не могу говорить о более строгих школах, но я делаю степень бакалавра в области общей статистики (самая строгую в моей школе) в Калифорнийском университете в Дэвисе, и я довольно сильно полагаюсь на строгость и происхождение. Докторантура по математике будет полезна, поскольку у вас будет очень хороший опыт в реальном анализе и линейной алгебре - полезные навыки в области статистики. В моей статистической программе около 50% курсовых работ направлено на поддержку основ (линейная алгебра, реальный анализ, исчисление, вероятность, оценка), а остальные 50% направлены на специализированные темы, основанные на основах (непараметрика, вычисления, ANOVA / Регрессия, временные ряды, байесовский анализ).
Как только вы получите базовые знания, переход к специфике обычно не так уж сложен. Большинство учеников в моих классах борются с доказательствами и реальным анализом и легко разбираются в статистических понятиях, поэтому совершенно точно поможет математический фон. Тем не менее, следующие два текста имеют довольно хорошее освещение многих тем, охватываемых статистикой. Кстати, и то, и другое было рекомендовано по указанной вами ссылке, поэтому я бы не стал отвечать на ваш вопрос, а тот, который вы указали, обязательно не коррелирован.
Математические методы статистики , Харальд Крамер
Вся статистика: краткий курс по статистическому выводу , Ларри Вассерман
источник
Королевское статистическое общество Великобритании предлагает диплом магистра в области статистики, который находится на уровне хорошей степени бакалавра. Программа, список чтения и прошлые статьи доступны на их веб-сайте . Я знал, что математики используют это, чтобы набрать скорость в статистике. Сдача экзаменов (официально или не выходя из собственного кабинета) может быть полезным способом измерения, когда вы там.
источник
Я посещал веб-сайты учебных программ лучших школ статистики, записывал книги, которые они используют в своих курсах для студентов, смотрел, какие из них высоко оценены на Amazon, и заказывал их в своей публичной / университетской библиотеке.
Некоторые школы, чтобы рассмотреть:
Дополните тексты различными лекционными видео сайтами, такими как MIT OCW и videolectures.net.
У Caltech нет степени бакалавра в области статистики, но вы не ошибетесь, если будете следовать учебным планам их курсов по статистике.
источник
Я видел статистический вывод Сильвея, который использовали математики, которым требовалось практическое понимание статистики. Это небольшая книга, и по праву должна быть дешевой. Глядя на http://www.amazon.com/Statistical-Inference-Monographs-Statistics-Probability/dp/0412138204/ref=sr_1_1?ie=UTF8&s=books&qid=1298750064&sr=1-1 , кажется, что это дешевая секундная стрелка.
Он старый и концентрируется на классической статистике. Хотя это не очень абстрактно, оно предназначено для достаточно математической аудитории - многие из упражнений взяты из Кембриджского (Великобритания) диплома по математической статистике, который в основном является магистром.
источник
Что касается измерения ваших знаний: вы можете посетить некоторые соревнования по сбору данных / анализу данных, такие как 1 , 2 , 3 , 4 , и посмотреть, как вы оцениваете по сравнению с другими.
В ответах много указателей на учебники по математической статистике. Я хотел бы добавить в качестве актуальных тем:
Отказ от ответственности: я не статистика, это только мои 2cents
источник
ET Jaynes "Теория вероятностей: логика науки: принципы и элементарные приложения, том 1", издательство Cambridge University Press, 2003, в значительной степени необходимо прочитать для байесовской стороны статистики, примерно на правильном уровне. Я с нетерпением жду рекомендаций для частой стороны вещей (у меня есть множество монографий, но очень мало хороших общих текстов).
источник
Я из области компьютерных наук, специализируюсь на машинном обучении. Тем не менее, я действительно начал понимать (и, что более важно, применять) статистику после прохождения курса по распознаванию образов с использованием книги Бишопа https://www.microsoft.com/en-us/research/people/cmbishop/#!prml-book
Вот несколько слайдов курса из MIT:
http://www.ai.mit.edu/courses/6.867-f03/lectures.html
Это просто даст вам фон (+ немного кода Matlab), чтобы использовать статистику для реальных задач, и определенно больше в прикладной части.
Тем не менее, это сильно зависит от того, что вы хотите сделать со своими знаниями. Чтобы определить, насколько вы хороши, вы, возможно, захотите просмотреть открытые курсы некоторых университетов для курсов продвинутой статистики, чтобы проверить, знакомы ли вы с обсуждаемыми темами. Просто мои 5 центов
источник
Я думаю, что Стэнфорд предоставляет лучшие ресурсы, когда дело доходит до гибкости. У них даже есть онлайн-курс по машинному обучению, который предоставит вам респектабельную базу знаний, когда речь заходит о разработке алгоритмов в R. Найдите его в Google, и он перенаправит вас на страницу Lagunita, где у них есть несколько интересных курсов, большинство из которых они были свободны. У меня есть книги Тибширани «Введение в статистическое обучение» и «Элементы статистического обучения» в форматах PDF, и оба они являются чрезвычайно хорошими ресурсами.
Поскольку вы математик, я бы все же посоветовал вам не ускоряться, поскольку это не обеспечило бы вам прочной основы, которая может оказаться очень полезной в будущем, если вы вообще начнете заниматься серьезным машинным обучением. Рассматривайте статистику как раздел математики для получения информации из данных, и это требует некоторой работы. Помимо этого, есть тонны онлайн-ресурсов, Джонс Хопкинс предоставляет такие же вещи, как Стэнфорд. Хотя опыт всегда окупается, респектабельные полномочия всегда будут укреплять эту базу. Вы также можете думать о конкретных полях, которые вы хотели бы ввести; под этим я подразумеваю, хотите ли вы заняться текстовой аналитикой или применить свои навыки математики и статистики в области финансов. Я прихожу в последнюю категорию, поэтому у меня есть степень по эконометрике, где мы изучали финансы + статистика. Комбинация всегда может быть очень хорошей.
источник