Введение в непараметрическую статистику

11

Я изучал статистику в течение последних двух лет. Почти все, что я узнал, о параметрической статистике. Теперь я хотел бы узнать больше о непараметрической статистике. Кто-нибудь может предложить какое-то краткое (возможно, читабельное) введение в эту область?

LaTeXFan
источник

Ответы:

12

Это зависит от того, что вы подразумеваете под «кратким», какой уровень лечения вы ищете (включая математические и интуитивные понятия), какие методы вы хотите включить.

Я настоятельно рекомендую начинать с книг и читать более одной книги .

« Практическая непараметрическая статистика » Коновера хороша, и я определенно хотел бы включить ее в любой список.

« Прикладная непараметрическая статистика » Дэниела очень хороша, достаточно обширна для своего размера.

Я обнаружил, что « тесты без распространения » Нейва и Уортингтона были очень удобочитаемыми, когда он только вышел (и во многом так и есть). В настоящее время код в нем выглядит несколько устаревшим, но, с другой стороны, он обычно достаточно читабелен для перевода. Если вы можете найти это, это хорошее введение; стоит взять вторую руку, если вы не купите ее новой.

Есть десятки хороших книг, некоторые старше трех упомянутых мною, некоторые новее; некоторые вполне могут подойти вам лучше, чем я упомянул. Я бы начал с университетской библиотеки и просмотрел поиски с такими терминами, как в названных выше названиях, и, если возможно, посмотрел, что рядом.

Прочитайте несколько из них и найдите несколько, которые вам нравятся.

Когда я делал непараметрические функции в качестве старшекурсника, в рекомендованном чтении было что-то около восьми книг, возможно, больше. У каждого из них было то, чего не хватало большинству других. Я рад, что я посмотрел на них всех.

Glen_b - Восстановить Монику
источник
4

Если вы изучаете мягкие науки (например, психологию, социологию, образование), я бы порекомендовал непараметрическую статистику поведенческих наук Зигеля и Кастеллана (McGraw-Hill Book Company). (У меня второе издание с 1988 года). Из предисловия:

Отличительной особенностью [является] пошаговая схема применения каждой процедуры к фактическим данным.

Джоэл Рейес Нош
источник
2

Я нашел «Полупараметрическую регрессию» Кэрролла, Ванда и других. быть вполне читабельным. Это устаревшая, но хорошая вещь, чтобы начать, прежде чем перейти к краткой, но плотной книге Саймона Вуда по GAM.

Обе эти книги фокусируются на регрессионных моделях с применением сплайнов, что далеко не все в непараметрической статистике. Но, пожалуй, наиболее полезно для прикладных людей.

generic_user
источник
1
20826: в качестве объяснения, на всякий случай вы находите этот ответ несколько запутанным - «непараметрический» может относиться не только к неопределенной (потенциально бесконечно-параметрической) функциональной форме для распределения (т.е. вы не указываете параметрическую форму для ), но также и для связи между переменными ( ). Ответ ACD здесь относится ко второму, а не к первому. На самом деле термин «непараметрический» по отношению к регрессионным моделям может применяться к любой проблеме, или даже к обоим одновременно (что я склонен называть «непараметрически вдвойне»). E ( Y ) = g ( x )FY(y)E(Y)=g(x)
Glen_b
правильно. просто любопытно, каковы некоторые примеры случаев в прикладной работе, где может быть полезна первая из двух форм непараметрической работы? или я думаю, что бутстрап был бы примером, верно?
generic_user
1
ACD, я рекомендую вам взглянуть на любую из книг, упомянутых в моих ответах. Я могу указать - в буквальном смысле - на многие тысячи статей, которые применяют их к реальным задачам, включая тесты Уилкоксона-Манна-Уитни, тесты на пригодность, такие как Колмогоров-Смирнов, корреляционные меры, такие как Кендалл и Спирман, регрессия Тейла-Сен Кривые выживания Каплана-Мейера (и тесты логарифмического ранга), перестановка / рандомизация (+ другие методы повторной выборки) и многое другое. В целом, я бы сказал, что на самом деле может применяться гораздо чаще, чем тот, который вы используете. Да, бутстрап включен.
Glen_b
1
(ctd) ... площадь довольно большая; если вы немного сузите его, я, вероятно, найду вам конкретные приложения.
Glen_b
1
Правильно, поэтому обычно это тесты, которые не основаны на предположениях о распределении. Я думаю, мне интересно, можно ли оценить непараметрическое распределение модели одновременно с оценкой отношений между переменными (вероятно, с большим количеством данных). Но, как вы указываете, есть много чего почитать.
generic_user
2

Я был удивлен, не увидев упоминания Ларри Вассермана « Вся непараметрическая статистика» .

Я думаю, что это отличная книга относительно краткого размера. Особенно, если кто-то уже имеет некоторый опыт в параметрической статистике, эта книга предлагает очень свежий взгляд на « статистические методы, которые стремятся сохранить как можно более слабое количество базовых допущений ». Я нашел это менее многословным, чем другие вводные / учебники для начинающих; это может быть хорошо или плохо в зависимости от ваших предпочтений. Единственная «дельта» этой книги состоит в том, что она не охватывает тесты ранга.

usεr11852
источник
(+1) Похоже, что книга Вассермана «Вся статистика» также содержит, хотя и более краткую, трактовку непараметрической статистики. Обе эти книги, как и многие другие, хороши, но ИМХО в некоторой степени излишни для прикладных исследователей / ученых. Конечно, знать все теоремы и доказательства не повредит, но это «приятно иметь», а не «иметь», учитывая ограничения по времени и объему. Мне еще предстоит найти сбалансированные статистические книги для прикладных ученых (то есть достаточно строгие, не вдаваясь в слишком глубокие детали, а также полезные с точки зрения приложений).
Александр Блех