Некоторые байесовцы нападают на частые выводы, утверждая, что «нет уникального распределения выборки», потому что это зависит от намерений исследователя (Kruschke, Aguinis, & Joo, 2012, p. 733).
Например, скажем, исследователь начинает сбор данных, но его финансирование было неожиданно сокращено после 40 участников. Как бы здесь были определены распределения выборки (и последующие CI и p-значения)? Будем ли мы просто предполагать, что каждый составляющий образец имеет N = 40? Или он будет состоять из выборок с различным N, причем каждый размер определяется другими случайными моментами, когда его финансирование могло быть сокращено?
Распределения t, F, хи-квадрат (и т. Д.) И нулевые значения, встречающиеся в учебниках, предполагают, что N является фиксированным и постоянным для всех составляющих выборок, но на практике это может быть не так При каждой отдельной процедуре остановки (например, после определенного промежутка времени или до тех пор, пока мой помощник не устает), кажется, что существует другое распределение выборки, и использование этих «проверенных и настоящих» распределений с фиксированным N нецелесообразно.
Насколько вредна эта критика легитимности частых КИ и р-ценностей? Есть теоретические опровержения? Кажется, что, нападая на концепцию распределения выборки, все здание частых выводов является незначительным.
Любые научные ссылки приветствуются.
Ответы:
Как правило, вы будете делать вывод при условии фактического размера выборки , потому что он является вспомогательным для параметров, представляющих интерес; то есть он не содержит информации об их истинных значениях, влияет только на точность, с которой вы можете измерить их. Кокс (1958), "Некоторые проблемы, связанные со статистическим выводом", Ann. Математика Statist. 29 , 2 обычно цитируется как первое объяснение того, что иногда называют принципом обусловленности, хотя это подразумевалось в гораздо более ранней работе, возвращаясь к идее Фишера о «соответствующих подмножествах».N
Если финансирование вашего исследователя было прекращено из-за разочаровывающих результатов, то, конечно, не является вспомогательным. Возможно, наиболее простой иллюстрацией проблемы является оценка вероятности Бернулли по схеме выборки с биномиальным (фиксированное число испытаний) или отрицательным биномиальным (с фиксированным номером успеха). Достаточная статистика одинакова для обоих, но ее распределение отличается. Как бы вы проанализировали эксперимент, в котором вы не знали, что за ним последовало? Berger & Wolpert (1988), Принцип правдоподобия, обсуждают значение этого и других правил остановки для вывода.N
Возможно, вы захотите подумать о том, что произойдет, если вы не примете во внимание распределение выборки. Armitage (1961), «Комментарий Смита к« Последовательности в статистическом выводе и принятии решений », JRSS B, 23 , 1 указал, что если вы выбираете из нормального распределения до , отношение правдоподобия для проверки того, что среднее против равно , поэтому исследователь может заранее установить предел для этого путем соответствующего выбораИкс N--√Икс¯≤ k μ = 0 μ ≠ 0 L ( 0 )L ( х¯)≤ е- к2/ 2 К , Только частый анализ может принять во внимание распределение отношения правдоподобия при этой довольно несправедливой схеме выборки. См. Ответы Kerridge (1963), «Границы частоты вводящих в заблуждение байесовских выводов», Ann. Математика Стат. , 34 , Cornfield (1966), «Последовательные испытания, последовательный анализ и принцип правдоподобия», The American Statistician , 20 , 2 , & Kadane (1996), «Принятие решения предрешено», JASA , 91 , 435
Выявить зависимость частых выводов от намерений исследователя - это полезная информация о людях (если они еще есть), которые высоко оценивают «субъективность» байесовского вывода. Лично я могу жить с этим; выполнение процедуры в течение длинных серий повторений всегда будет чем-то более или менее условным, что не умаляет его полезности («калибровка вероятности» - это то, как Кокс описывал p-значения). ). По датам ссылок вы могли заметить, что эти проблемы не очень новые; попытки урегулировать их с помощью априорной аргументации в значительной степени прекратились (за исключением Интернета, всегда отставая от времени, за исключением тривиальных вопросов) &
PS: Думая добавить противовес Berger & Wolpert, я наткнулся на Cox & Mayo (2010), «Объективность и обусловленность в выводе для частых» в « Ошибка и умозаключение» . Весьма вероятно, что в моем утверждении о том, что дебаты прекратились, есть элемент желаемого мышления, но поразительно, как мало нового можно сказать по этому вопросу через полвека или около того. (Тем не менее, это краткая и красноречивая защита частых идей.)
источник
Краткий ответ на ваш вопрос: это зависит от того, кого вы спрашиваете ;-) Стойкие байесовцы объявят победу или, по крайней мере, паритет с методикой частых исследований. Жесткие частые пользователи по умолчанию будут "Это не может быть ответа". Остальные 99% статистиков будут использовать те методы, которые, как было показано, являются надежными в непрерывных экспериментах.
Я знаю, что чувствительность распределения выборки к намерениям исследователя может вызывать беспокойство, и действительно нет хорошего решения этой проблемы. Байесовцы и частисты должны использовать некоторую субъективность и суждение при принятии решения о том, как сделать вывод. Тем не менее, я думаю, что вы берете пример из области, которая, как правило, противоречива и ставит проблемы исключительно на почве частых умозаключений. Последовательные и / или остановленные эксперименты являются классическими примерами субъективной природы вывода ... и на который нет абсолютно объективного и согласованного ответа.
Как насчет регулярного вывода, где вы на самом деле собираете образец, который вы намеревались получить? Здесь, я думаю, что лидеры имеют преимущество, так как значения CI и p хорошо откалиброваны по своим повторным свойствам выборки, тогда как байесовский вывод сохраняет свою личную и субъективную природу.
Если вы хотите более теоретическое изложение байесовского ответа, я бы прочитал об «условном заключении» с ключевыми исследователями, такими как Нэнси Рейд и Леманн.
источник