У меня было достаточно курсов по статистике в школьные годы и в университете. У меня есть четкое понимание таких понятий, как CI, p-значения, интерпретация статистической значимости, множественное тестирование, корреляция, простая линейная регрессия (с наименьшими квадратами) (общие линейные модели) и все проверки гипотез. Я познакомился с ним большую часть ранних дней в основном математически. И в последнее время, с помощью книги « Интуитивная биостатистика» , я верю в беспримерное понимание реальной концептуальной теории.
Теперь мне не хватает понимания соответствия моделей (оценки параметров модели) и тому подобного. В частности, такие понятия, как оценка максимального правдоподобия, обобщенные линейные модели, байесовские подходы к выводной статистике, всегда кажутся мне чуждыми. Нет достаточного количества примеров, учебных пособий или концептуально обоснованных, как можно было бы найти на простых вероятностных моделях или на других (основных) темах в Интернете.
Я биоинформатик, и я работаю над данными RNA-Seq, которые имеют дело с необработанными подсчетами чтения для определения, скажем, экспрессии генов (или дифференциальной экспрессии генов). Исходя из моего прошлого, даже если я не знаком со статистическими моделями, я могу понять причину предположения о распределении Пуассона и отрицательных биномов и т. Д. Но некоторые статьи имеют дело с обобщенными линейными моделями и оценивают MLE и т. Д., Которые Я считаю, что у меня есть необходимые знания для понимания.
Я предполагаю, что я прошу о подходе, который некоторые эксперты среди вас считают полезным, и (а) книге (-ях), которая помогает мне понять эти концепции более интуитивным способом (не только строгой математикой, но и теорией, подкрепленной математикой). Поскольку я в основном собираюсь их применять, я был бы удовлетворен (на данный момент) пониманием того, что к чему, и позже я могу вернуться к строгим математическим доказательствам ... У кого-нибудь есть какие-либо рекомендации? Я не против купить больше одной книги, если темы, которые я просил, действительно разбросаны, чтобы быть покрытыми книгой.
Большое спасибо!
Ответы:
Вы найдете все не байесовское, что вы спросили об этом Стратегии регрессионного моделирования Фрэнка Харрелла . Я бы оставил байесовские рекомендации более осведомленным людям (хотя у меня на полке лежат Гельман, Карлин, Стерн и Рубин , а также Гилкс, Ричардсон и Шпайгельхальтер ). На рынке должно быть несколько книг Байесовского биостата.
Обновление: McCullach and Nelder (1989) - это, конечно, классическая книга по GLM. Это было революционно для своего времени, но я нахожу это довольно скучным, честно говоря. Кроме того, он не охватывает более поздние добавления, такие как остаточная диагностика, модели с нулевым раздуванием или многоуровневые / иерархические расширения. Hardin и Hilbe (2007) подробно описывают некоторые из этих более новых вещей на практических примерах в Stata (где GLM и расширения очень хорошо реализованы; Хардин работал в Stata Corp., писал многие из этих команд, а также вносил вклад в сэндвич-оценка).
источник
Я бы порекомендовал следующие две книги:
источник