Мое понимание байесовской и частой дискуссии состоит в том, что статистика для частых:
- является (или претендует на то, чтобы быть) объективным
- или, по крайней мере, непредвзято
- поэтому разные исследователи, используя разные допущения, могут все же получить количественно сопоставимые результаты
пока байесовская статистика
- утверждает, что делает «лучшие» прогнозы (т.е. снижает ожидаемые потери), потому что он может использовать предыдущие знания (среди других причин)
- требуется меньше «специальных решений», заменив их предыдущими / модельными вариантами, которые (по крайней мере, в принципе) имеют реальную интерпретацию.
Учитывая это, я ожидал бы, что байесовская статистика будет очень популярна в SPC: если бы я был владельцем фабрики, пытавшимся контролировать качество своих процессов, я бы в первую очередь заботился об ожидаемых потерях; Если бы я мог уменьшить это, потому что у меня больше / лучше, чем у моих конкурентов, даже лучше.
Но практически все, что я читал о SPC, похоже, часто встречается (то есть, никаких предварительных распределений, точечных оценок всех параметров, множества специальных вариантов размера выборки, p-значений и т. Д.)
Это почему? Я могу понять, почему статистика по частым исследованиям была лучшим выбором в 1960-х годах, когда SPC делали с помощью ручки и бумаги. Но почему никто не пробовал другие методы с тех пор?
источник
Ответы:
ПРЕДУПРЕЖДЕНИЕ. Я написал этот ответ давным-давно, очень мало понимая, о чем я говорю. Я не могу удалить это, потому что это было принято, но я не могу поддержать большую часть содержания.
Это очень длинный ответ, и я надеюсь, что он будет в некотором роде полезным. SPC - не моя сфера деятельности, но я думаю, что эти комментарии достаточно общие, чтобы применить их здесь.
Я бы сказал, что наиболее часто упоминаемое преимущество - способность учитывать предыдущие убеждения - это слабое преимущество прикладных / эмпирических областей. Это потому, что вам нужно определить количество ваших предшественников. Даже если я могу сказать «ну, уровень z определенно неправдоподобен», я не могу на всю жизнь сказать вам, что должно происходить ниже z. Если авторы не начнут публиковать свои необработанные данные в массовом порядке, мои лучшие догадки для приоры - это условные моменты, взятые из предыдущей работы, которые могут соответствовать или не соответствовать условиям, с которыми вы сталкиваетесь.
По сути, байесовские методы (по крайней мере, на концептуальном уровне) отлично подходят для тех случаев, когда у вас есть сильное предположение / идея / модель и вы хотите перенести их в данные, а затем посмотреть, насколько вы ошибаетесь или не ошибаетесь. Но часто вы не смотрите, правы ли вы в отношении одной конкретной модели для вашего бизнес-процесса; скорее у тебя нетмодель, и посмотреть, что будет делать ваш процесс. Вы не хотите выдвигать свои выводы, вы хотите, чтобы ваши данные подталкивали ваши выводы. Если у вас достаточно данных, это все равно произойдет, но в таком случае зачем беспокоиться о предыдущих? Возможно, это слишком скептически и не склонно к риску, но я никогда не слышал о оптимистичном бизнесмене, который также был успешным. Невозможно измерить вашу неуверенность в своих собственных убеждениях, и вы не рискуете быть слишком уверенным в своих ошибках. Таким образом, вы устанавливаете неинформативный априор, и преимущество исчезает.
Это интересно в случае с SPC, потому что, в отличие, скажем, от цифрового маркетинга, ваши бизнес-процессы не всегда находятся в непредсказуемом состоянии. У меня сложилось впечатление, что бизнес-процессы имеют тенденцию меняться намеренно и постепенно. То есть вам нужно долго строить хорошие, безопасные приоры. Но помните, что все приоры направлены на распространение неопределенности. Помимо субъективности, байесианство имеет то преимущество, что оно объективно распространяет неопределенность в процессах создания глубоко вложенных данных. Для меня это действительно то, для чего нужна байесовская статистика. И если вы ищете надежность своего процесса, выходящую далеко за пределы «значимости» 1 к 20, кажется, что вы захотите учесть как можно большую неопределенность.
Так где же байесовские модели? Во-первых, они сложно реализовать, Говоря прямо, я могу научить OLS инженеру-механику за 15 минут и заставить его запустить регрессии и t-тесты в Matlab в другой 5. Чтобы использовать байесовский метод, мне сначала нужно решить, какую модель мне подходит, а затем посмотреть, есть ли готовая библиотека для этого на языке, который знает кто-то в моей компании. Если нет, я должен использовать ошибки или Стэн. А потом мне нужно запустить симуляции, чтобы получить хотя бы базовый ответ, и это займет около 15 минут на 8-ядерном компьютере с i7. Так много для быстрого прототипирования. И во-вторых, к тому времени, как вы получите ответ, вы потратили два часа на кодирование и ожидание, только чтобы получить тот же результат, который вы могли бы получить с частыми случайными эффектами с кластерными стандартными ошибками. Может быть, это все самонадеянно и неправильно, и я совсем не понимаю SPC.
Я сравниваю байесианство с очень качественным ножом шеф-повара, кастрюлей и сотейником ; Частота - это как кухня, полная инструментов «как видно по телевизору», таких как банановые нарезки и кастрюли с отверстиями в крышке для легкого слива . Если вы опытный повар с большим опытом работы на кухне - на самом деле, на своей собственной кухне с предметными знаниями, которая чиста и организована, и вы знаете, где все расположено - вы можете делать удивительные вещи с помощью своего небольшого выбора элегантные, качественные инструменты. Или, вы можете использовать кучу разных маленьких специальных инструментов *, которые требуют нулевого навыка, чтобы сделать еду простой, действительно не наполовину плохой, и с парой базовых ароматов, которые отражают суть. Вы только что вернулись из шахт данных и жаждете результатов; какой повар ты?
* Байес такой же случайный, но менее прозрачный . Сколько вина идет в твоей компании? Понятия не имею, тебе это нравится, потому что ты профессионал. Или вы не можете определить разницу между Пино Гриджио и Пино Нуар, но в первом рецепте Epicurious сказано, что нужно использовать 2 чашки красного, так что вы это и сделаете. Какой из них более "ad-hoc"?
источник
По моему скромному мнению, байесовская статистика страдает некоторыми недостатками, которые противоречат ее широкому использованию (в SPC, но и в других исследовательских секторах):
Труднее получить оценки по сравнению с его частыми коллегами (самая широкая часть классов по статистике использует частичный подход. Кстати, было бы интересно выяснить, является ли это причиной или следствием ограниченной популярности байесовской статистики ).
Очень часто Байесовская статистика навязывает выбор различных способов решения одной и той же проблемы (например, какой из них лучше предшествует?), А не просто щелкни и посмотри (во всяком случае, этот подход также не следует поощрять в рамках системы часто встречающихся).
Байесовская статистика имеет некоторые темы, которыми трудно управлять менее чем опытным статистикам (например, неправильным априорам );
Это требует анализа чувствительности (обычно избегаемого в рамках системы часто встречающихся) и исключений, сделанных для некоторых тем, таких как анализ отсутствующих данных.
Он имеет только одно (похвально, бесплатно загружаемое) программное обеспечение, доступное для расчета.
Это занимает больше времени , чтобы быть самостоятельным исследователем с Байесом , чем с инструментами частотными.
источник
Одна из причин заключается в том, что байесовская статистика была заморожена из основного потока примерно до 1990 года. Когда я изучал статистику в 1970-х годах, это была почти ересь (не везде, но в большинстве программ для выпускников). Это не помогло, что большинство интересных проблем были неразрешимы. В результате почти каждый, кто преподает статистику сегодня (и рецензирует статьи для журналов, разрабатывает учебные планы), обучается как частый специалист. Ситуация начала меняться примерно в 1990 году с популяризацией методов Марковской цепи Монте-Карло (MCMC), которые постепенно находят свое применение в таких пакетах, как SAS и Stata. Лично я думаю, что они будут гораздо более распространены через 10 лет, хотя в специализированных приложениях (SPC) они могут не иметь большого преимущества.
Одна группа, которая просыпается, делает байесовский анализ более доступным - это группа, разрабатывающая пакет STAN (mc-stan.org).
источник