Я часто слышу утверждение, что байесовская статистика может быть очень субъективной. Основным аргументом является то, что логический вывод зависит от выбора априора (хотя для выбора априора можно использовать принцип безразличия или максимальной энтропии). По сравнению с утверждением, статистика часто встречается более объективно. Сколько правды в этом утверждении?
Кроме того, это заставляет меня задуматься:
- Каковы конкретные элементы статистической статистики (если таковые имеются), которые могут быть особенно субъективными и которые отсутствуют или являются менее важными в байесовской статистике?
- Является ли субъективность более распространенной в байесовской статистике, чем в статистике частых исследований?
bayesian
interpretation
frequentist
philosophical
Амелио Васкес-Рейна
источник
источник
Ответы:
Я тоже. Но обратите внимание, что существует большая двусмысленность в названии чего-то субъективного.
Субъективность (оба чувства)
Субъективный может означать (по крайней мере) один из
Байесианство субъективно во втором смысле, потому что оно всегда предлагает способ обновить убеждения, представленные распределениями вероятностей, путем обусловливания информацией. (Обратите внимание, что то, являются ли эти убеждения убеждениями, которые на самом деле имеет какой-либо субъект, или просто убеждениями, которые может иметь субъект, не имеет отношения к решению, является ли оно «субъективным».)
На самом деле, если настоятель представляет вашу личную веру о чем-то, то вы почти наверняка выбираете ее не больше, чем большинство своих убеждений. И если оно представляет чьи-то убеждения, то оно может быть более или менее точным представлением этих убеждений, поэтому по иронии судьбы будет довольно «объективный» факт о том, насколько хорошо оно представляет их.
Можно, хотя это не имеет тенденцию обобщать очень плавно в непрерывные области. Кроме того, возможно, невозможно быть плоским или «безразличным» во всех параметризациях одновременно (хотя я никогда не был полностью уверен, почему вы хотели бы быть).
Итак, как мы можем оценить это утверждение?
Я полагаю, что во втором втором субъективном смысле: это в основном правильно. И в первом смысле субъективно: это, вероятно, неверно.
Частота как субъективная (второе чувство)
Некоторые исторические детали полезны для картирования проблем
Для Неймана и Пирсона есть только индуктивное поведение, а не индуктивный вывод, и все статистические оценки работают с долгосрочными выборочными свойствами оценок. (Отсюда альфа и анализ мощности, но не значения р). Это довольно субъективно в обоих смыслах.
Действительно, возможно, и я думаю, что вполне разумно утверждать в этом духе, что Frequentism на самом деле вовсе не является структурой вывода, а скорее набором критериев оценки для всех возможных процедур вывода, которые подчеркивают их поведение при повторном применении. Простыми примерами могут быть последовательность, непредвзятость и т. Д. Это делает его явно не субъективным в смысле 2. Однако это также может быть субъективным в смысле 1, когда мы должны решить, что делать, если эти критерии не применяются (например, когда нет непредвзятая оценка, которая будет иметься) или когда они применяются, но противоречат.
Фишер предложил менее субъективную частоту, которая интересна. Для Фишера существует такая вещь, как индуктивный вывод, в том смысле, что субъект, ученый, делает выводы на основе анализа данных, проведенного статистиком. (Следовательно, p-значения, но не альфа и анализ мощности). Однако решения о том, как вести себя, проводить ли исследования и т. Д., Принимаются ученым на основе ее понимания теории предметной области, а не статистиком, применяющим парадигму вывода. Из-за этого фишерского разделения труда как субъективность (смысл 2), так и отдельный субъект (смысл 1) находятся на стороне науки, а не на стороне статистики.
Legalistically говоря, Frequentism Фишера является субъективным. Просто субъективный субъект не статистик.
Существуют различные синтезы этих доступных, как едва уловимое сочетание этих двух, которое вы найдете в учебниках по прикладной статистике, так и более детализированные версии, например, «Статистика ошибок», предложенная Деборой Майо. Последнее довольно субъективно в смысле 2, но в высшей степени субъективно в смысле 1, потому что исследователь должен использовать научное суждение - стиль Фишера - чтобы выяснить, какие вероятности ошибок имеют значение, и их следует проверить.
Частота как субъективная (первое чувство)
Так разве частотность менее субъективна в первом смысле? По-разному. Любая процедура вывода может быть пронизана индивидуальными особенностями, как они применяются на самом деле. Поэтому, возможно, более полезно спросить, поощряет ли Frequentism менее субъективный (в первом смысле) подход? Я сомневаюсь в этом - я думаю, что самосознательное применение субъективных (второе чувство) методов приводит к менее субъективным (первое чувство) результатам, но это можно утверждать в любом случае.
Предположим на мгновение, что субъективность (первое чувство) проникает в анализ через «выбор». Байесианизм, кажется, включает в себя больше «вариантов выбора». В простейшем случае выбор соответствует: одному набору потенциально уникальных допущений для Frequentist (функция вероятности или эквивалент) и двум наборам для байесовского (вероятность и априор над неизвестными).
Тем не менее, байесовцы знают, что они субъективны (во втором смысле) во всех этих вариантах, поэтому они склонны быть более сознательными в отношении последствий, которые должны привести к меньшей субъективности (в первом смысле).
Напротив, если кто-то ищет тест в большой книге тестов, то у него может возникнуть ощущение, что результат менее субъективен (первое чувство), но, возможно, это результат подмены понимания проблемы другим субъектом для собственного , Не ясно, что кто-то стал менее субъективным, но это может показаться так. Я думаю, что большинство согласится, что это бесполезно.
источник
Субъективность в частых подходах широко распространена в применении умозаключений. Когда вы проверяете гипотезу, вы устанавливаете уровень достоверности, скажем, 95% или 99%. Откуда это? Это не откуда-либо, кроме ваших собственных предпочтений или преобладающей практики в вашей области.
Байесовский априор очень мало влияет на большие наборы данных, потому что, когда вы обновляете его данными, апостериорное распределение будет отклоняться от вашего предыдущего, так как обрабатывается все больше и больше данных.
Сказав, что байесовцы начинают с субъективного определения вероятностей, убеждений и т. Д. Это отличает их от частых, которые думают с точки зрения объективных вероятностей. В небольших наборах данных это имеет значение
ОБНОВЛЕНИЕ: Я надеюсь, что вы ненавидите философию так же сильно, как и я, но время от времени у них возникают интересные мысли, подумайте о субъективизме . Откуда я знаю, что я действительно на SE? Что если это моя мечта? и т.д. :)
источник