Что является байесовским аналогом t-критерия с двумя выборками с неравными дисперсиями?

11

Я ищу байесовский аналог t-критерия с двумя выборками с неравными отклонениями (критерий Уэлча). Я также ищу многовариантный тест, такой как статистика Т Хотеллинга. Отзывы приветствуются.

Для многомерного случая предположим, что у нас есть и , где (соответственно ) - это сокращение для среднего значения выборки, стандартного отклонения выборки и количества точек. Можно предположить, что число точек является постоянным по всему набору данных, стандартное отклонение одинаково для всех (соответственно, ) и что средние значения выборки для (соответственно, ) коррелированы. Если вы построите пример средства, они следуют друг за другом, и, соединяя их, вы получаете плавно меняющуюся функцию. Теперь на некоторых частях функции совпадает с( z 1 , , z N ) y i z i y i z i y i z i y z(y1,,yN)(z1,,zN)yiziyiziyiziyzфункция, но в других это не так, потому что становится большим. Я хотел бы дать количественную оценку этому заявлению. mean(yi)mean(zi)std(yi)+std(zi)

Янник
источник
Я обновил свой ответ.
Джон Сальватье
Ввод слова "behrens fisher" в поле поиска приводит к ценной информации о байесовском подходе к двум независимым выборкам с неравными отклонениями.
Стефан Лоран

Ответы:

6

Хотя вы можете сделать это байесовским способом, задумывались ли вы о том, будет ли лучше оценивать разницу в средствах, а не проверять, отличаются ли они? Это то, что Эндрю Гельман часто рекомендует . Я могу представить некоторые возможные причины для того, чтобы захотеть проверить гипотезы, но я не думаю, что они настолько распространены.

Я не думаю, что вам нужно что-то вроде t-теста, потому что вы можете хорошо оценить стандартное отклонение, потому что вы сказали, что группы имеют очень похожие стандартные отклонения.

Если это так, то я думаю, что эта ссылка должна быть вам нужна. Он показывает, как оценить разницу в средствах или сделать проверку гипотезы (хотя я не рекомендую это). Вы также можете взглянуть на ту часть, на которую они ссылаются в книге Болстада (вы можете найти электронные копии в Интернете). Можно также включать оценку отклонений, но это более сложно, так что я подозреваю, что вам лучше включить имеющуюся у вас ранее информацию об отклонениях наивным способом (например, используя несмещенную оценку Stdev на каждом из наборов и затем усредните их и сделайте вид, что это ваши «известные» stdevs).

Джон Сальватье
источник
да, но это приводит к другой проблеме. Как узнать, значительна ли разница в средствах? Я бы сравнил это с суммой SD каждого образца, но это не очень строго.
Янник
@yannick: «значительный», статистически или реальный?
Уэйн
@ Уэйн в реальном мире, наверное.
Янник
3
@yannick: Реальное значение - это проблема знания предметной области, а не статистическая. То есть я могу вам сказать, что у меня есть некоторые данные о весе, и существует статистически значимая разница в 10 г в средних весах между двумя группами на уровне 95%, но имеет ли это значение в реальном мире? Для гольяна, да, для взрослых мужчин, нет. Если вы говорите о значении в реальном мире, я бы подумал, что сравнение с SD или определение квантилей ответит на ваш вопрос, даже если это не кажется строгим и оставляет место для кого-то, кто не согласен с вами.
Уэйн
@ Уэйн Предположим, я смотрю на , вы говорите, что решение о том, когда мы можем сказать «значительный» размер эффекта, является произвольным? И как же выбор функции связи, которая бы отображала это количество в [0: 1]? Разве нет практических вещей, которые делают люди? m1m2s1+s2
Янник
12

Джон Крушке разработал метод Байеса, который представляет собой замену критерия Стьюдента с двумя образцами. Процедура называется BEST (байесовская оценка заменяет T-критерий) и описана здесь . Я также сделал онлайн версию JavaScript, которая работает в браузере, доступную здесь .

Расмус Батх
источник