Отказ от ответственности: я не статистика, а инженер-программист. Большая часть моих знаний в области статистики основана на самообразовании, поэтому у меня все еще есть много пробелов в понимании концепций, которые могут показаться здесь банальными для других людей. Поэтому я был бы очень благодарен, если бы ответы включали менее конкретные термины и больше объяснений. Представь, что ты разговариваешь со своей бабушкой :)
Я пытаюсь понять природу из бета - распределения - то , что она должна быть использована и как интерпретировать его в каждом конкретном случае. Если бы мы говорили, скажем, о нормальном распределении, то можно было бы описать его как время прибытия поезда: чаще всего оно прибывает как раз вовремя, немного реже - на 1 минуту раньше или на 1 минуту позже, и очень редко оно прибывает с разницей 20 минут от среднего. Равномерное распределение описывает, в частности, шанс каждого билета в лотерее. Биноминальное распределение можно описать с помощью монетных монет и так далее. Но есть такое интуитивное объяснение о бета - распределении ?
Допустим, и . Бета-распределение в этом случае выглядит следующим образом (сгенерировано в R):β = .5 B ( α , β )
Но что это на самом деле означает? Ось Y, очевидно, является плотностью вероятности, но что находится на оси Х?
Я был бы очень признателен за любое объяснение, будь то с этим примером или любым другим.
Ответы:
Краткая версия заключается в том, что бета-распределение можно понимать как представление распределения вероятностей, то есть оно представляет все возможные значения вероятности, когда мы не знаем, что это за вероятность. Вот мое любимое интуитивное объяснение этого:
Любой, кто следит за бейсболом, знаком со средними значениями ватина - просто количество раз, когда игрок получает базовый удар, деленное на количество раз, когда он повышается в бите (так что это просто процент между
0
и1
)..266
в целом считается средним уровнем ватина, в то время.300
как считается отличным.Представьте, что у нас есть бейсболист, и мы хотим предсказать, каков будет его средний уровень за весь сезон. Вы могли бы сказать, что мы можем пока просто использовать его среднее значение, но это будет очень плохой показатель в начале сезона! Если игрок один раз подходит к бите и получает сингл, его среднее значение кратковременно
1.000
, в то время как если он выбивает, его среднее значение равно0.000
. Не намного лучше, если вы подойдете к бите пять или шесть раз - вы можете получить счастливую полосу и получить среднее значение1.000
или неудачную полосу и получить среднее значение0
, ни одно из которых не является хорошим показателем того, как ты будешь бить в этом сезонеПочему ваш средний уровень в первых нескольких попаданиях не является хорошим показателем вашего возможного среднего? Когда первая ат-бит игрока является аутом, почему никто не предсказывает, что он никогда не получит хит за весь сезон? Потому что мы идем с предыдущими ожиданиями. Мы знаем, что в истории большинство средних показателей за сезон колебались между чем-то вроде
.215
и.360
с некоторыми редкими исключениями с обеих сторон. Мы знаем, что если игрок получает несколько аутов подряд с самого начала, это может указывать на то, что он окажется чуть хуже среднего, но мы знаем, что он, вероятно, не отклонится от этого диапазона.Учитывая нашу среднюю проблему, которая может быть представлена в виде биномиального распределения (серии успехов и неудач), лучший способ представить эти априорные ожидания (то, что мы в статистике называем априорными ) - это бета-распределение - оно говорит: прежде чем мы увидим, как игрок совершил свой первый удар, мы примерно ожидаем, что его средний уровень будет. Область распространения бета-версии
(0, 1)
, как и вероятность, так что мы уже знаем, что мы на правильном пути, но пригодность бета-версии для этой задачи выходит далеко за рамки этого.Мы ожидаем, что средний уровень игрока в течение сезона будет наиболее вероятнымα = 81 β= 219
.27
, но может варьироваться от разумного.21
до.35
. Это можно представить с помощью бета-распределения с параметрами и β = 219 :Я придумал эти параметры по двум причинам:
(.2, .35)
- разумного диапазона для среднего значения.Вы спросили, что представляет ось х на графике плотности бета-распределения - здесь она представляет его среднее значение. Таким образом, обратите внимание, что в этом случае не только ось Y является вероятностью (или, точнее, плотностью вероятности), но также является осью X (в конце концов, среднее значение ватита - это просто вероятность попадания)! Бета-распределение представляет собой распределение вероятностей вероятностей .
Но вот почему бета-версия является такой подходящей. Представьте, что игрок получает один удар. Его рекорд за сезон сейчас
1 hit; 1 at bat
. Затем мы должны обновить наши вероятности - мы хотим немного сдвинуть всю эту кривую, чтобы отразить нашу новую информацию. Хотя математика для доказательства этого немного сложна ( она показана здесь ), результат очень прост . Новый бета-дистрибутив будет:Обратите внимание, что он почти не изменился - это изменение действительно невидимо невооруженным глазом! (Это потому, что один удар ничего не значит).
Обратите внимание, что кривая теперь и тоньше, и смещена вправо (более высокий средний уровень), чем раньше - мы лучше понимаем, каков средний уровень игрока.
Таким образом, бета-распределение лучше всего подходит для представления вероятностного распределения вероятностей - случай, когда мы не знаем заранее, что такое вероятность, но у нас есть некоторые разумные предположения.
источник
Распределение Беты используются для моделирования вещи , которые имеют ограниченный диапазон, как от 0 до 1.
Примерами являются вероятность успеха в эксперименте, имеющем только два результата, таких как успех и неудача. Если вы проводите ограниченное количество экспериментов, и некоторые из них успешны, вы можете представить то, что вам говорит, с помощью бета-версии.
Другой пример - статистика заказов . Например, если вы генерируете несколько (скажем, 4) одинаковых 0,1 случайных чисел и сортируете их, каково распределение 3-го?
Подробнее об этом ...
источник
Этот результат показывает, что бета-распределения естественным образом появляются в математике, и у нее есть некоторые интересные приложения в математике.
источник
Есть две основные мотивы:
Во-первых, бета-распределение сопряжено до распределения Бернулли. Это означает, что если у вас есть неизвестная вероятность, такая как смещение монеты, которое вы оцениваете повторными бросками монет, то вероятность, вызванная неизвестным смещением последовательностью бросков монет, является бета-распределенной.
Бета-дистрибутив не является специальным для общего моделирования вещей над [0,1], поскольку многие дистрибутивы могут быть усечены до этой поддержки и более применимы во многих случаях.
источник
Предположим, продавец на каком-то сайте электронной коммерции получает 500 оценок, из которых 400 хороших и 100 плохих.
Наивное качество с точки зрения рейтингов продавца составляет 80%, потому что 0,8 = 400/500. Но «истинного» качества с точки зрения рейтингов мы не знаем.
http://www.joyofdata.de/blog/an-intuitive-interpretation-of-the-beta-distribution/
источник
До настоящего времени преобладание ответов охватывало обоснование для бета-значений RV, генерируемых как предыдущие, для пропорций выборки, и один умный ответ связывал бета-значения RV со статистикой заказов.
Бета-распределения также возникают из простой взаимосвязи между двумя гамма-лучами (k_i, 1) RV, i = 1,2 называют их X и Y. X / (X + Y) имеет бета-распределение.
Гамма RVs уже имеют свое обоснование в моделировании времени прибытия для независимых событий, поэтому я не буду рассматривать это, поскольку это не ваш вопрос. Но «часть времени», потраченная на выполнение одной из двух задач, выполняемых последовательно, естественно, предоставляет бета-версию.
источник
Моя интуиция говорит, что она «весит» как текущую долю успеха « », так и текущую долю неудачи « ( 1 - х ) »: f ( x ; α , β )Икс ( 1 - х ) е( х ; α , β) = постоянная ⋅ xα - 1( 1 - х )β- 1 1 / B ( α , β) α β это как «вес» для вклада неудачи. У вас есть двумерное пространство параметров (одно для вклада успехов и одно для вклада неудач), что делает его немного трудным для размышления и понимания.
источник
В приведенном примере параметры альфа = 81 и бета = 219 по сравнению с предыдущим годом [81 попадание в 300 на летучих мышах или (81 и 300 - 81 = 219)]
Я не знаю, что они называют предварительным предположением о 81 попадании и 219 выходах, но на английском это априорное предположение.
Обратите внимание, как в течение сезона кривая сдвигается влево или вправо, а модальная вероятность сдвигается влево или вправо, но кривая все еще существует.
Интересно, вступит ли Лаа Больших Чисел в конце концов и приведет ли средний уровень обратно к 0,270.
Чтобы угадать альфа и бета в целом, нужно взять полное количество предыдущих вхождений (у летучих мышей), среднее значение ватина, как известно, получить общее количество попаданий (альфа), бета или общее количество минус неудачи) и вуаля - у тебя есть твоя формула Затем обработайте дополнительные данные, как показано.
источник
Кстати, что происходит, если вы производите распределение размеров по микроскопическим наблюдениям, и у вас есть распределение частиц по числу, и ваша цель - работать с распределением по объему? Практически обязательно получить исходный дистрибутив в количестве, ограниченном справа. Таким образом, преобразование является более последовательным, потому что вы уверены, что в новом распределении томов не появляется ни режима, ни медианы, ни среднего размера из интервала, с которым вы работаете. Кроме того, вы избегаете эффекта Гренландии в Африке.
Преобразование очень легко, если у вас есть правильные формы, то есть сфера или призма. Вы должны добавить три единицы к альфа-параметру распределения числа бета и получить распределение объема.
источник
Я думаю, что нет никакой интуиции за бета-дистрибуцией! Бета-дистрибутив - это очень гибкий дистрибутив с диапазоном FIX! А для целых чисел a и b даже легко разобраться. Также многие особые случаи бета-версии имеют свое собственное значение, например, равномерное распределение. Таким образом, если данные нужно смоделировать подобным образом или с немного большей гибкостью, тогда бета-версия - очень хороший выбор.
источник
В другом вопросе, касающемся бета-распространения, представлена следующая интуиция, стоящая за бета-версией
Для получения подробной информации, пожалуйста, ознакомьтесь с полным ответом на https://stats.stackexchange.com/a/429754/142758.
источник