Я недавно закончил со степенью магистра по медицинскому и биологическому моделированию, сопровождаемый инженерной математикой в качестве фона. Несмотря на то, что моя образовательная программа включала в себя значительное количество курсов по математической статистике (список приведен ниже), которыми я руководил с довольно высокими оценками, я часто полностью терял взгляд на теорию и применение статистики. Должен сказать, что по сравнению с «чистой» математикой статистика для меня мало что значит. Особенно нотации и язык, используемые большинством статистиков (включая моих прошлых лекторов), раздражающе запутаны, и почти ни в одном из ресурсов, которые я видел до сих пор (включая википедию), не было простых примеров, которые можно было бы легко связать и связать с данной теорией. ..
Это фон. Я также осознаю горькую реальность того, что я не могу сделать карьеру исследователя / инженера без твердого контроля над статистикой, особенно в области биоинформатики.
Я надеялся, что смогу получить некоторые советы от более опытных статистиков / математиков. Как я могу преодолеть эту проблему, которую я упомянул выше? Знаете ли вы о каких-либо хороших ресурсах; такие как книги, электронные книги, открытые курсы (через iTunes или OpenCourseware для бывших) и т. д.
РЕДАКТИРОВАТЬ: Как я уже упоминал, я весьма склонен (отрицательно) к большинству литературы под общим названием статистики, и так как я не могу купить несколько больших (и дорогих) учебников для каждой отрасли статистики, что мне нужно с точки зрения книги это нечто похожее на то, что Tipler & Mosca для физики, но вместо этого для статистики.
Для тех, кто не знает о Типлере; Это большой учебник, который охватывает большинство предметов, с которыми можно столкнуться во время обучения в высших учебных заведениях, и представляет каждый из них от базового введения до чуть более подробного описания. По сути, идеальный справочник, купленный им в течение моего первого года в универе, до сих пор использую его время от времени.
Курсы, которые я взял по статистике:
- большой вводный курс,
- стационарные случайные процессы,
- Марковские процессы,
- Методы Монте-Карло
- Анализ выживания
Вы знакомы с Байесовским анализом данных (Гельман, Карлин, Стерн и Рубин)? Может быть, это то, что вам нужно в дозе.
источник
Все проблемы со статистикой в основном сводятся к следующим 4 шагам (которые я позаимствовал у @whuber для ответа на другой вопрос ):
Оцените параметр.
Оцените качество этой оценки.
Изучите данные.
Оцените подгонку.
Вы можете обменять параметр слова с моделью слова .
Книги статистики обычно представляют первые два пункта для различных ситуаций. Проблема в том, что каждое реальное приложение требует своего подхода, а следовательно, и другой модели, поэтому большая часть книг заканчивается каталогизацией этих различных моделей. Это приводит к нежелательному эффекту, так как легко потерять себя в деталях и упустить общую картину.
Большая иллюстрированная книга, которую я от всей души рекомендую, - Асимптотическая статистика . Это дает строгое отношение к теме и математически "чисто". Хотя в его названии упоминается асимптотическая статистика, большой секрет в том, что большинство методов классической статистики по существу основаны на асимптотических результатах.
источник
Я думаю, что наиболее важным здесь является развитие интуиции о статистике и некоторых общих статистических концепциях. Возможно, лучший способ сделать это - иметь домен, которым вы можете «владеть». Это может обеспечить положительный цикл обратной связи, в котором понимание домена помогает вам лучше понять основную статистику, помогает понять больше о домене и т. Д.
Для меня эта область была бейсбольной статистикой. Я понял, что тест, который идет 3 на 4 в игре, не является «настоящим» .750 нападающим. Это помогает понять более общую мысль о том, что примеры данных не совпадают с базовым распределением. Я также знаю, что он, вероятно, ближе к среднему игроку, чем к нападающему .750, так что это помогает понять такие понятия, как регрессия к среднему. Оттуда я могу перейти к полномасштабному байесовскому выводу, где в моем предыдущем распределении вероятностей было среднее значение среднего бейсболиста, и теперь у меня есть 4 новых выборки, с помощью которых можно обновить мое апостериорное распределение.
Я не знаю, что этот домен для вас, но я думаю, это было бы более полезным, чем простой учебник. Примеры помогают понять теорию, которая помогает понять примеры. Учебник с примерами хорош, но если вы не можете сделать эти примеры "вашими", то мне интересно, получите ли вы от них достаточно.
источник
В качестве альтернативы стратегиям регрессионного моделирования и для более практического подхода, Прикладные линейные статистические модели очень хороши с моей точки зрения.
источник
Все учатся по-разному, но я думаю, можно с уверенностью сказать, что примеры, примеры, примеры, очень помогают в статистике. Моим предложением было бы выучить R (достаточно основ, чтобы сильно помочь), и тогда вы можете попробовать любой пример, пока ваши глаза не кровоточат. Вы можете отсортировать, подогнать, построить, назвать. И, поскольку R ориентирован на статистику, по мере изучения R вы будете изучать статистику. Те книги, которые вы перечислили, могут быть атакованы с точки зрения «покажи мне».
Поскольку R бесплатен, а многие исходные материалы бесплатны, все, что вам нужно инвестировать, это ваше время.
http://www.mayin.org/ajayshah/KB/R/index.html
http://math.illinoisstate.edu/dhkim/rstuff/rtutor.html
http://www.cyclismo.org/tutorial/R/
http://www.stat.pitt.edu/stoffer/tsa2/R_time_series_quick_fix.htm
http://www.statmethods.net/about/books.html
Есть много хороших книг по R, которые вы можете купить, вот одну, которую я использовал:
http://www.amazon.com/Introductory-Statistics-R-Peter-Dalgaard/dp/0387954759
Редактировать ============
Я забыл добавить пару ссылок. Если вы используете Windows, хорошим редактором для R является Tinn-R (кто-то другой может добавить ссылки для редакторов на Mac или Linux).
http://www.sciviews.org/Tinn-R/
http://cran.r-project.org/web/packages/TinnR/
источник
Я лично любил это, у которого было действительно хорошее сочетание теории и применения (с большим количеством примеров). Это было хорошее совпадение с Казеллой и Бергером для более теоретического подхода. И для широкого обзора кисти это .
источник