В чем разница между бесплатной статистикой / методами распределения и непараметрической статистикой?

12

Из Википедии

Первое значение непараметрических охватывает методы, которые не полагаются на данные, принадлежащие к какому-либо конкретному распределению. К ним, среди прочего, относятся:

  • методы без распределения, которые не основаны на предположениях о том, что данные взяты из заданного распределения вероятностей. Как таковая, она является противоположностью параметрической статистики. Он включает в себя непараметрические статистические модели, логические выводы и статистические тесты.
  • непараметрическая статистика (в смысле статистики по данным, которая определяется как функция в выборке, которая не зависит от параметра), интерпретация которой не зависит от совокупности, подходящей для любых параметризованных распределений. Статистика, основанная на рангах наблюдений, является одним из примеров такой статистики, и они играют центральную роль во многих непараметрических подходах.

Я не вижу различий между этими двумя случаями: методы распространения бесплатно и непараметрическая статистика. Они оба не предполагают, что данные поступают из какого-то распределения? Чем они отличаются?

Спасибо и всего наилучшего!

Тим
источник
1
Определение, которое вы цитируете, предполагает, что второе является подмножеством первого, но поскольку они фактически определили их там (я бы поменял некоторые части этих определений на другой термин!) - и, как правило, на практике - они кажутся используется взаимозаменяемо. Непараметрический в этом смысле в основном означает «бесконечно-параметрический», в то время как методы без распределения - это методы, реализация и свойства которых, такие как нулевые распределения, не зависят от формы распределения. Некоторые книги делают различие между этими двумя; если я подумаю о ссылке, я вернусь и добавлю ее.
Glen_b
@Glen_b: Спасибо! Некоторые ссылки также будут оценены!
Тим
@Glen_b: Почему «второе является подмножеством первого»? Я чувствую обратное. Не могли бы вы дать мне знать некоторые ссылки? Благодаря!
Тим
«Это включает непараметрические статистические модели» - вот что создает такое впечатление. Ссылки на определения терминов? В различных книгах по статистике без распределения / непараметрии предпринимаются попытки определения или различия; Прошло много времени с тех пор, как я прочитал их несколько, но стандартные книги, такие как Коновер, Брэдли, Даниэль, Мараскуило и МакСвини, Линдли, были бы началом. Из них я был бы склонен сначала проверить Брэдли. У меня есть только Коновер, Нив и Уортингтон; Я не нашел определения ни в нескольких минутах поиска - к моему удивлению; Я хоть у обоих что-то есть.
Glen_b
@Glen_b: Спасибо! Как вы думаете, какое-либо из двух значений непараметрической статистики в цитате связано со статистикой без распределения?
Тим

Ответы:

5

Наглядный пример различия - сравнение выборок из двух популяций.

С первым определением вы все равно можете сравнить средние значения двух популяций, каким-то образом используя выборки, чтобы сделать выводы (например, сравнивая выборочные значения). Значения совокупности являются параметрами, но вы не делаете никаких предположений о распределении (например, вы не предполагаете, что совокупность распределена нормально). Так что это статистика "без распространения". Я, я не думаю, что это следует назвать частью непараметрической статистики - из-за очевидного логического противоречия.

Под вторым определением вы вообще не учитываете среднее значение популяции или любой другой параметр. Вместо этого вы используете такие методы, как сравнение рейтинга. Это настоящая непараметрическая статистика.

Питер Эллис
источник
Благодаря! В обоих случаях не зависят ли распределения их статистики от истинного распределения выборки?
Тим
Согласны ли вы с Glen_b, что «второе является подмножеством первого»?
Тим
Тим, я не думаю, что второе является подмножеством первого; Пожалуйста, перечитайте мой комментарий, и вы увидите, что это совсем не то, что я сказал. Я описывал то, о чем вы, по-видимому, говорили. Если я говорю «похоже, Билл думает, что X», это не значит, что «Glen_b думает, что X». Я не могу думать ничего подобного.
Glen_b
1
Независимо от того, кто (если кто-то) так думает, нет, второй случай не является подмножеством первого. Второй случай явно исключает интерес к параметрам, которые находятся в центре внимания первого.
Питер Эллис
@PeterEllis Это хороший момент
Glen_b