Поскольку можно рассчитать доверительные интервалы для p-значений, а противоположностью оценки интервалов является точечная оценка: является ли p-значение точечной оценкой?
32
Поскольку можно рассчитать доверительные интервалы для p-значений, а противоположностью оценки интервалов является точечная оценка: является ли p-значение точечной оценкой?
Ответы:
Точечные оценки и доверительные интервалы предназначены для параметров, которые описывают распределение, например, среднее или стандартное отклонение.
Но в отличие от других статистических данных выборки, таких как среднее значение выборки и стандартное отклонение выборки, значение p не является полезной оценкой интересного параметра распределения. Посмотрите на ответ @whuber для технических деталей.
Значение p для тестовой статистики дает вероятность того, что отклонение от ожидаемого значения тестовой статистики будет наименьшим по сравнению с наблюдаемым в выборке, рассчитанное в предположении, что нулевая гипотеза верна. Если у вас есть полное распределение, оно либо соответствует нулевой гипотезе, либо нет. Это можно описать с помощью индикаторной переменной (снова см. Ответ @whuber).
Но значение p нельзя использовать в качестве полезной оценки переменной индикатора, поскольку оно не является согласованным, поскольку значение p не сходится при увеличении размера выборки, если нулевая гипотеза верна. Это довольно сложный альтернативный способ заявить, что статистический тест может либо отклонить, либо не отклонить нулевое значение, но никогда не подтвердит его.
источник
Да, можно (и было) утверждать, что значение p является точечной оценкой.
Чтобы определить какое-либо свойство распределения, которое может оценить p-значение, мы должны предположить, что оно асимптотически несмещено. Но, асимптотически, среднее значение p для нулевой гипотезы равно (в идеале; для некоторых тестов это может быть другое ненулевое число), а для любой другой гипотезы - . Таким образом, значение p можно считать оценкой половины индикаторной функции для нулевой гипотезы.01/2 0
По общему признанию требуется некоторая креативность, чтобы рассмотреть p-ценность таким способом. Мы могли бы сделать немного лучше, рассматривая рассматриваемую оценку как решение, которое мы принимаем с помощью p-значения: является ли базовое распределение членом нулевой гипотезы или альтернативной гипотезы? Давайте назовем это множество возможных решений . Джек Кифер пишетD
В этом случае, поскольку дискретен, «достаточно гладкая» не является ограничением вообще. Терминология Кифера отражает это, ссылаясь на статистические процедуры с дискретными пространствами принятия решений как «тесты» вместо «точечных оценок».D
Хотя интересно исследовать пределы (и ограничения) таких определений, поскольку этот вопрос предлагает нам сделать, возможно, нам не следует слишком настаивать на том, что значение p является точечной оценкой, поскольку это различие между оценщиками и тестами является одновременно полезный и обычный.
В комментарии к этому вопросу Кристиан Роберт обратил внимание на статью 1992 года, где он и соавторы взяли именно эту точку зрения и проанализировали допустимость значения p в качестве оценки функции индикатора . Смотрите ссылку в ссылках ниже. Бумага начинается,
[Акцент добавлен.]
Ссылки
Цзюнн Цон Хванг, Джордж Казелла, Кристиан Роберт, Мартин Т. Уэллс и Роджер Х. Фаррелл, Оценка точности при тестировании . Энн. Statist. Том 20, № 1 (1992), 490-509. Открытый доступ .
Джек Карл Кифер, Введение в статистический вывод . Springer-Verlag, 1987.
источник
источник