У меня есть два образца ( в обоих случаях). Средство отличается примерно вдвое от объединенного стандартного. девиация Результирующее значение T составляет приблизительно 10. Хотя приятно знать, что я убедительно показал, что средние значения не одинаковы, мне кажется, это обусловлено большим n. Глядя на гистограммы данных, я, конечно, не чувствую, что, например, небольшое значение p действительно представляет данные, и, честно говоря, не очень удобно их цитировать. Я, наверное, задаю не тот вопрос. Я думаю: хорошо, средства разные, но действительно ли это имеет значение, поскольку дистрибутивы существенно перекрываются?
Это где Байесовское тестирование полезно? Если так, то где хорошее место, чтобы начать, немного поиска в Google не принесло ничего полезного, но я не могу, задавая правильный вопрос. Если это неправильно, у кого-нибудь есть предложения? Или это просто предмет для обсуждения, а не количественный анализ?
источник
Ответы:
Пусть обозначает среднее значение для первой популяции, а μ 2 обозначает среднее значение для второй популяции. Похоже, что вы использовали t- тест из двух выборок, чтобы проверить, является ли μ 1 = μ 2 . Значительный результат подразумевает, что μ 1 ≠ μ 2 , но разница, по-видимому, слишком мала, чтобы иметь значение для вашего приложения.μ1 μ2 T μ1= μ2 μ1≠ μ2
Вы столкнулись с тем, что статистически значимым часто может быть что-то иное, чем значимое для приложения . В то время как разница может быть статистически значимой он все еще может не быть значимым .
Байесовское тестирование не решит эту проблему - вы все равно просто заключите, что разница существует.
Однако может быть выход. Например, для односторонней гипотезы вы можете решить, что если на Δ единиц больше, чем μ 2, то это будет значительная разница, которая достаточно велика, чтобы иметь значение для вашего приложения.μ1 Δ μ2
В этом случае вы будете проверять, будет ли вместо μ 1 - μ 2 = 0 . В этом случае t- статистика (при условии равных дисперсий) будет T = ˉ x 1 - ˉ x 2 - Δμ1- μ2≤ Δ μ1- μ2= 0 T
гдеsp- общая оценка стандартного отклонения. Согласно нулевой гипотезе, эта статистикаt-распределяется сn1+n2-2степенями свободы.
Простой способ выполнить этот тест - вычесть из ваших наблюдений из первой популяции, а затем провести регулярный односторонний t- тест с двумя выборками.Δ T
источник
Уместно сравнить несколько подходов, но не с целью выбора того, который отвечает нашим желаниям / убеждениям.
Мой ответ на ваш вопрос: возможно, что два дистрибутива накладываются друг на друга, в то время как они имеют разные средства, что, по-видимому, является вашим случаем (но нам нужно увидеть ваши данные и контекст, чтобы дать более точный ответ).
Я собираюсь проиллюстрировать это, используя пару подходов для сравнения обычных средств .
Для определения вероятности профиля и вероятности см. 1 и 2 .
Для смоделированных данных их можно рассчитать в R следующим образом
Опять же, доверительные интервалы для средств не перекрываются ни на одном разумном уровне.
В заключение вы можете увидеть, как все эти подходы указывают на существенную разницу средств (что является основным интересом), несмотря на перекрытие распределений.
Надеюсь, это поможет.
источник
Отвечая на правильный вопрос
Любой тест, который спрашивает, отличаются ли групповые средства, при правильной работе скажет, отличаются ли средства. Это не скажет вам, что распределение самих данных отличается, так как это другой вопрос. Этот вопрос, безусловно, зависит от того, различаются ли средства, но также и от многих других вещей, которые могут (не полностью) обобщаться как дисперсия, перекос и эксцесс.
Вы правильно заметили, что уверенность в том, где находятся эти средства, зависит от объема данных, которые вы должны оценить, поэтому наличие большего количества данных позволит вам определить средние различия в почти перекрывающихся распределениях. Но вам интересно,
На самом деле это не так, по крайней мере, не напрямую. И это по замыслу. Это является представителем (приблизительно говоря) уверенности, которую вы можете иметь, что конкретная пара выборочных статистических данных (а не сами данные) отличается.
Если вы хотите представить сами данные более формально, чем просто показывать гистограммы и моменты их тестирования, тогда, возможно, пара графиков плотности может оказаться полезной. Скорее, это действительно зависит от аргумента, который вы используете для теста.
Байесовская версия
Во всех этих отношениях байесовские разностные «тесты» и Т-тесты будут вести себя одинаково, потому что они пытаются сделать то же самое. Единственные преимущества, которые я могу придумать для использования байесовского подхода, заключаются в следующем: а) то, что будет легко провести тест, допускающий, возможно, различные отклонения для каждой группы, и б) что он будет сосредоточен на оценке вероятного размера разницы в средних. вместо того, чтобы найти значение р для некоторого теста на разницу. Тем не менее, эти преимущества довольно незначительны: например, в б) вы всегда можете сообщить доверительный интервал для разницы.
Кавычки выше над «тестами» являются преднамеренными. Конечно, можно проводить тестирование байесовской гипотезы, и люди делают. Тем не менее, я хотел бы предположить, что сравнительное преимущество этого подхода заключается в том, чтобы сосредоточить внимание на построении правдоподобной модели данных и передаче ее важных аспектов с соответствующими уровнями неопределенности.
источник
Прежде всего, это не проблема, чтобы закрепить частое тестирование. Проблема заключается в нулевой гипотезе, что средства точно равны. Поэтому, если популяции различаются по среднему значению на любое небольшое количество, а размер выборки достаточно велик, вероятность отклонить эту нулевую гипотезу очень высока. Поэтому значение p для вашего теста оказалось очень маленьким. Виновником является выбор нулевой гипотезы. Выберите d> 0 и примите нулевую гипотезу о том, что средние значения отличаются менее чем на d менее чем на d. Вы выбираете d так, чтобы реальная разница была достаточно большой, чтобы ее можно было отклонить. Ваша проблема исчезнет. Байесовское тестирование не решит вашу проблему, если вы настаиваете на нулевой гипотезе точного равенства средств.
источник