Субъективность в частной статистике

14

Я часто слышу утверждение, что байесовская статистика может быть очень субъективной. Основным аргументом является то, что логический вывод зависит от выбора априора (хотя для выбора априора можно использовать принцип безразличия или максимальной энтропии). По сравнению с утверждением, статистика часто встречается более объективно. Сколько правды в этом утверждении?

Кроме того, это заставляет меня задуматься:

  1. Каковы конкретные элементы статистической статистики (если таковые имеются), которые могут быть особенно субъективными и которые отсутствуют или являются менее важными в байесовской статистике?
  2. Является ли субъективность более распространенной в байесовской статистике, чем в статистике частых исследований?
Амелио Васкес-Рейна
источник
5
Конечно, часто используемые методы гораздо более субъективны, чем рекламируемые, но я бы сказал, что байесовские методы еще более субъективны. И, пожалуйста, не убеждайте себя, что неизменность вашего априора в группе или спецификации априора MaxEnt как-то «объективна» - оба типа априора потенциально выражают убеждения, которые я считаю информативными, и в любом случае ни одна из стратегий не применима в полной общности (например, я не думаю, что в пространстве CDF есть инвариант или априор MaxEnt, и любой предыдущий в этом пространстве назначает вероятность 1 топологически скудному набору).
парень
2
Байесовцы начинают с субъективной основы, а затем данные (надеюсь) возвращают их обратно в объективную реальность. Частые участники начинают (или, по крайней мере, думают, что они делают) с объективных позиций, но затем они в конечном итоге портят анализ своими субъективными предположениями.
Аксакал почти наверняка бинарный
2
Байесовцы оба знают и прямо говорят о своих предположениях. Частые, как правило, нет.
Алексис

Ответы:

15

Я часто слышу утверждение, что байесовская статистика может быть очень субъективной.

Я тоже. Но обратите внимание, что существует большая двусмысленность в названии чего-то субъективного.

Субъективность (оба чувства)

Субъективный может означать (по крайней мере) один из

  1. зависит от особенностей исследователя
  2. явно связаны с состоянием знаний человека

Байесианство субъективно во втором смысле, потому что оно всегда предлагает способ обновить убеждения, представленные распределениями вероятностей, путем обусловливания информацией. (Обратите внимание, что то, являются ли эти убеждения убеждениями, которые на самом деле имеет какой-либо субъект, или просто убеждениями, которые может иметь субъект, не имеет отношения к решению, является ли оно «субъективным».)

Основным аргументом является то, что вывод зависит от выбора

На самом деле, если настоятель представляет вашу личную веру о чем-то, то вы почти наверняка выбираете ее не больше, чем большинство своих убеждений. И если оно представляет чьи-то убеждения, то оно может быть более или менее точным представлением этих убеждений, поэтому по иронии судьбы будет довольно «объективный» факт о том, насколько хорошо оно представляет их.

(хотя можно использовать принцип безразличия или максимальной энтропии для выбора априора).

Можно, хотя это не имеет тенденцию обобщать очень плавно в непрерывные области. Кроме того, возможно, невозможно быть плоским или «безразличным» во всех параметризациях одновременно (хотя я никогда не был полностью уверен, почему вы хотели бы быть).

По сравнению с утверждением, статистика часто встречается более объективно. Сколько правды в этом утверждении?

Итак, как мы можем оценить это утверждение?

Я полагаю, что во втором втором субъективном смысле: это в основном правильно. И в первом смысле субъективно: это, вероятно, неверно.

Частота как субъективная (второе чувство)

Некоторые исторические детали полезны для картирования проблем

Для Неймана и Пирсона есть только индуктивное поведение, а не индуктивный вывод, и все статистические оценки работают с долгосрочными выборочными свойствами оценок. (Отсюда альфа и анализ мощности, но не значения р). Это довольно субъективно в обоих смыслах.

Действительно, возможно, и я думаю, что вполне разумно утверждать в этом духе, что Frequentism на самом деле вовсе не является структурой вывода, а скорее набором критериев оценки для всех возможных процедур вывода, которые подчеркивают их поведение при повторном применении. Простыми примерами могут быть последовательность, непредвзятость и т. Д. Это делает его явно не субъективным в смысле 2. Однако это также может быть субъективным в смысле 1, когда мы должны решить, что делать, если эти критерии не применяются (например, когда нет непредвзятая оценка, которая будет иметься) или когда они применяются, но противоречат.

Фишер предложил менее субъективную частоту, которая интересна. Для Фишера существует такая вещь, как индуктивный вывод, в том смысле, что субъект, ученый, делает выводы на основе анализа данных, проведенного статистиком. (Следовательно, p-значения, но не альфа и анализ мощности). Однако решения о том, как вести себя, проводить ли исследования и т. Д., Принимаются ученым на основе ее понимания теории предметной области, а не статистиком, применяющим парадигму вывода. Из-за этого фишерского разделения труда как субъективность (смысл 2), так и отдельный субъект (смысл 1) находятся на стороне науки, а не на стороне статистики.

Legalistically говоря, Frequentism Фишера является субъективным. Просто субъективный субъект не статистик.

Существуют различные синтезы этих доступных, как едва уловимое сочетание этих двух, которое вы найдете в учебниках по прикладной статистике, так и более детализированные версии, например, «Статистика ошибок», предложенная Деборой Майо. Последнее довольно субъективно в смысле 2, но в высшей степени субъективно в смысле 1, потому что исследователь должен использовать научное суждение - стиль Фишера - чтобы выяснить, какие вероятности ошибок имеют значение, и их следует проверить.

Частота как субъективная (первое чувство)

Так разве частотность менее субъективна в первом смысле? По-разному. Любая процедура вывода может быть пронизана индивидуальными особенностями, как они применяются на самом деле. Поэтому, возможно, более полезно спросить, поощряет ли Frequentism менее субъективный (в первом смысле) подход? Я сомневаюсь в этом - я думаю, что самосознательное применение субъективных (второе чувство) методов приводит к менее субъективным (первое чувство) результатам, но это можно утверждать в любом случае.

Предположим на мгновение, что субъективность (первое чувство) проникает в анализ через «выбор». Байесианизм, кажется, включает в себя больше «вариантов выбора». В простейшем случае выбор соответствует: одному набору потенциально уникальных допущений для Frequentist (функция вероятности или эквивалент) и двум наборам для байесовского (вероятность и априор над неизвестными).

Тем не менее, байесовцы знают, что они субъективны (во втором смысле) во всех этих вариантах, поэтому они склонны быть более сознательными в отношении последствий, которые должны привести к меньшей субъективности (в первом смысле).

Напротив, если кто-то ищет тест в большой книге тестов, то у него может возникнуть ощущение, что результат менее субъективен (первое чувство), но, возможно, это результат подмены понимания проблемы другим субъектом для собственного , Не ясно, что кто-то стал менее субъективным, но это может показаться так. Я думаю, что большинство согласится, что это бесполезно.

conjugateprior
источник
4
Словарное определение «субъективного» (прямо из Google) гласит: основано на личных чувствах, вкусах или мнениях или под их влиянием. например, «его взгляды являются очень субъективными» синонимами: личностный, персонализированный, индивидуальный, внутренний, эмоциональный, инстинктивный, интуитивный, импрессионистский . Обратите внимание, что это отражает народную теорию о том, что «взгляд» (то есть убеждение) является субъективным (смысл 1: импрессионистский, интуитивный, странный и т. Д.), Поскольку он касается внутреннего состояния конкретного субъекта (смысл 2: персонализированный, индивидуальный и т. Д.). .) а не публичный, т.е. безличный .
сопряженный
2
Может быть полезно подумать о когнитивной психологии в качестве примера. Эта область является полностью субъективной (во втором смысле, потому что это все о внутренних состояниях людей и их влиянии на поведение этих людей), но это не субъективно в первом смысле, потому что психологи не могут просто сидеть и делать вещи на основа собственного внутреннего состояния.
сопряженный
2
Противоположная крайность, где что-то совершенно уникальное и субъективное (смысл 1), но на самом деле совсем не касается предметов, найти сложнее. Возможно, Лукреций, объясняющий атомы и пустоту в de Rerum Naturae, является примером.
сопряженный
1
Точно. Английский совершенно бесполезен об этом ...
conjugateprior
1
и я одобрил (и немного подкорректировал) предлагаемое изменение
сопряженный
6

Субъективность в частых подходах широко распространена в применении умозаключений. Когда вы проверяете гипотезу, вы устанавливаете уровень достоверности, скажем, 95% или 99%. Откуда это? Это не откуда-либо, кроме ваших собственных предпочтений или преобладающей практики в вашей области.

Байесовский априор очень мало влияет на большие наборы данных, потому что, когда вы обновляете его данными, апостериорное распределение будет отклоняться от вашего предыдущего, так как обрабатывается все больше и больше данных.

Сказав, что байесовцы начинают с субъективного определения вероятностей, убеждений и т. Д. Это отличает их от частых, которые думают с точки зрения объективных вероятностей. В небольших наборах данных это имеет значение

ОБНОВЛЕНИЕ: Я надеюсь, что вы ненавидите философию так же сильно, как и я, но время от времени у них возникают интересные мысли, подумайте о субъективизме . Откуда я знаю, что я действительно на SE? Что если это моя мечта? и т.д. :)

Аксакал почти наверняка бинарный
источник
1
Помимо выбора уровня достоверности при проверке гипотез (поскольку это можно утверждать в байесовской статистике, например, при выборе критериев сравнения HDP / HDI с ROPE для отклонения или принятия гипотезы ), играет ли субъективность роль в получение точечной оценки или получение доверительных интервалов, возможно, при выборе оценщиков?
Амелио Васкес-Рейна
1
Кроме того, я понимаю, что уровни значимости устанавливаются в статистике Frequentist в контексте принятия решений (т.е. мы должны отклонить нулевую гипотезу?), А не в вычислении вероятностей. В байесовской теории принятия решений то же самое можно утверждать о выборе функции потерь, которая может влиять на оптимальное (выбранное) решение. Более того, значения уровня достоверности обычно выбираются из приемлемого уровня ошибок типа I (например, 95% в NHST прямо установлено из уровня ложных срабатываний «не выше 5%»)
Амелио Васкес-Рейна
4
Nп«NпN
5
Возможно, стоит отметить, что функции потерь могут быть не субъективными (то есть полностью определенными контекстом), и в этом случае байесовские оптимальные решения могут быть полностью объективными, помимо предыдущих.
1
α