То же самое, другое отклонение

14

Предположим, у вас есть восемь бегунов, которые проводят гонку; распределение их индивидуальных времен выполнения является нормальным, и каждый имеет среднее значение , скажем, секунд. Стандартное отклонение первого бегуна - самое маленькое, два - второе самое маленькое, третье - самое маленькое и т. Д., А восемь - самое большое. Меня смущают два вопроса: (1) какова вероятность того, что первый выиграет у последнего, и (2) кто с наибольшей вероятностью выиграет гонку?11

Мои ответы и соответственно. Поскольку они имеют одинаковое среднее значение, вероятность того, что равна всего лишь , нет? Как я могу строго продемонстрировать вторую часть и можно ли рассчитать точную вероятность выигрыша? Заранее спасибо.8 ˉ х 1 - ˉ х 8 < 0 1 / 21/28Икс¯1-Икс¯8<01/2

Джордж Теддер
источник
1
@Silverfish При сравнении первого (смоделированного как случайная переменная ) с последним ( , предположительно независимым от ) нам нужно только рассмотреть . Это имеет симметричное непрерывное распределение с нулевым средним. Вероятность того, что первый победит последним, - это вероятность того, что , что (по симметрии и непрерывности) равно как заявлено. Хотя последний имеет больше шансов на победу в гонке, в этом нет никакого парадокса: большую часть времени, когда первый бьется последним, кто-то другой действительно выигрывает гонку. Х п Х 1 Z = Х 1 - Х п Z < 0 1 / 2X1XnX1Z=X1XnZ<01/2
whuber
1
@whuber Спасибо, мне удалось исказить то, что я имел в виду - удалит, чтобы избежать путаницы. Фигура 1/2 правильно, но ответ , чтобы сравнить их среднее время неправильно и , кажется, приглашает к путанице с помощью населения. Как вы пишете, это должно быть разница в X я . xi¯Xi
Серебряная
@Silver Это подчеркивает опасность предположения, что мы всегда знаем, что означает чья-то запись, просто потому, что она выглядит знакомой. Я замутил эту проблему (с подчеркиванием, появившимся на « » и « x 8 »), потому что предполагаемое значение было достаточно ясным и подразумевало, что ни один из них не может представлять среднее значение чего-либо: в этом контексте они должны отстаивать Сами случайные величины (которые я написал X 1 и X n ). x1x8X1Xn
whuber

Ответы:

15

Хотя точная вероятность не может быть вычислена (за исключением особых обстоятельств с ), она может быть быстро рассчитана численно с высокой точностью. Несмотря на это ограничение, можно строго доказать, что у бегуна с наибольшим стандартным отклонением есть наибольшие шансы на победу. На рисунке изображена ситуация и показано, почему этот результат интуитивно очевиден:n2

фигура

Показана плотность вероятности для времен пяти бегунов. Все они непрерывны и симметричны относительно общего среднего . (Масштабированные бета-плотности использовались для обеспечения положительного времени.) Одна плотность, выделенная темно-синим цветом, имеет гораздо больший разброс. Видимая часть в его левом хвосте представляет времена, с которыми обычно не может сравниться ни один другой бегун. Поскольку этот левый хвост с относительно большой площадью представляет значительную вероятность, у бегуна с такой плотностью больше всего шансов выиграть гонку. (У них также больше всего шансов прийти последним!)μ

Эти результаты доказаны не только для нормальных распределений: представленные здесь методы в равной степени применимы к симметричным и непрерывным распределениям . (Это будет интересно всем, кто возражает против использования нормальных распределений для моделирования времени выполнения.) Когда эти предположения нарушаются, возможно, что у бегуна с наибольшим стандартным отклонением не будет наибольшего шанса на победу (я оставляю конструкцию контрпримеров для заинтересованным читателям), но мы все еще можем доказать при более мягких предположениях, что у бегуна с самым большим SD будет лучший шанс на победу при условии, что SD достаточно велик.

На рисунке также показано, что такие же результаты могут быть получены при рассмотрении односторонних аналогов стандартного отклонения (так называемой «вариабельности»), которые измеряют дисперсию распределения только в одну сторону. У бегуна с большим разбросом влево (к лучшим временам) должен быть больше шанс выиграть, независимо от того, что происходит в остальной части распределения. Эти соображения помогают нам понять, как свойство быть лучшим (в группе) отличается от других свойств, таких как средние.


Пусть - случайные величины, представляющие время бегунов. Вопрос предполагает, что они независимы и нормально распределены с общим средним значением μ . (Хотя это буквально невозможная модель, поскольку она дает положительные вероятности для отрицательных времен, она все же может быть разумным приближением к реальности, если стандартные отклонения существенно меньше, чем μ .)X1,,Xnμμ

Чтобы выполнить следующий аргумент, сохраните предположение о независимости, но в противном случае предположите, что распределения задаются F i, и что эти законы распределения могут быть любыми. Для удобства также предположим, что распределение F n непрерывно с плотностью f n . Позже, при необходимости, мы можем применить дополнительные допущения, если они включают случай нормальных распределений.XiFiFnfn

Для любого и бесконечно малого d y вероятность того, что последний бегун имеет время в интервале ( y - d y , y ] и является самым быстрым бегуном, получается путем умножения всех соответствующих вероятностей (поскольку все времена независимы):ydy(ydy,y]

Pr(Xn(ydy,y],X1>y,,Xn1>y)=fn(y)dy(1F1(y))(1Fn1(y)).

Интеграция во все эти взаимоисключающие возможности дает

Pr(Xnmin(X1,X2,,Xn1))=Rfn(y)(1F1(y))(1Fn1(y))dy.

Для нормальных распределений этот интеграл не может быть оценен в замкнутой форме, когда : он требует численной оценки.n>2

фигура

На этом рисунке изображены подынтегральные функции для каждого из пяти бегунов со стандартными отклонениями в соотношении 1: 2: 3: 4: 5. Чем больше SD, тем больше функция смещена влево - и тем больше становится ее площадь. Области примерно 8: 14: 21: 26: 31%. В частности, у бегуна с самым большим SD есть шанс выиграть 31%.


Хотя закрытая форма не может быть найдена, мы все же можем сделать убедительные выводы и доказать, что бегун с самым большим SD, скорее всего, победит. Нам нужно изучить, что происходит при изменении стандартного отклонения одного из распределений, скажем, . Когда случайная величина X n масштабируется на σ > 0 вокруг ее среднего значения, ее SD умножается на σ и f n ( y ) d y изменится на f n ( y / σ ) d y / σFnXnσ>0σfn(y)dyfn(y/σ)dy/σ, Изменение переменной в интеграле дает выражение для вероятности выигрыша бегуна n как функцию σ :y=xσnσ

ϕ(σ)=Rfn(y)(1F1(yσ))(1Fn1(yσ))dy.

Предположим теперь, что медианы всех распределений равны и что все распределения симметричны и непрерывны с плотностями f i . (Это, безусловно, имеет место в условиях вопроса, потому что нормальное медиана является его средним значением.) Простым (локальным) изменением переменной мы можем предположить, что эта общая медиана равна 0 ; симметрия означает f n ( y ) = f n ( - y ) и 1 - F j ( - y ) = F j ( y)nfi0fn(y)=fn(y) Для всех у . Эти соотношения позволяют нам объединить интеграл по ( - , 0 ] с интегралом по ( 0 , ), чтобы получить1Fj(y)=Fj(y)y(,0](0,)

ϕ(σ)=0fn(y)(j=1n1(1Fj(yσ))+j=1n1Fj(yσ))dy.

Функция дифференцируема. Его производная, полученная дифференцированием подынтегрального выражения, представляет собой сумму интегралов, где каждый член имеет видϕ

yfn(y)fi(yσ)(jin1Fj(yσ)jin1(1Fj(yσ)))

для .i=1,2,,n1

Сделанные нами предположения о распределениях были разработаны таким образом, чтобы гарантировать, что при x 0 . Таким образом, поскольку x = y σ 0 , каждый член в левом произведении превышает соответствующий ему член в правом произведении, подразумевая, что разность продуктов неотрицательна. Другие факторы y f n ( y ) f i ( y σ ) явно неотрицательны, потому что плотности не могут быть отрицательными иFj(x)1Fj(x)x0x=yσ0yfn(y)fi(yσ) . Мы можем заключить, что ϕ ( σ ) 0 при σ 0 , доказывая, чтовероятность того, что игрок n выиграет, увеличивается со стандартным отклонением X n .y0ϕ(σ)0σ0nXn

nXnXi1/nnnn

Whuber
источник
@Phonon Это верно. (Но, пожалуйста, не путайте распределения с оценками, полученными из выборок. Распределение - это математическая модель, а не набор данных.) Увеличение SD с коэффициентомλскажем, равномерно растягивает горизонтальную ось. Поскольку (по закону полной вероятности) функция плотности будет охватывать единицу площади, это растяжение должно быть компенсировано растяжением вертикальной оси на1/λ, тем самым сохраняя все области. Таким образом, меньшие SD соответствуют более высоким пикам, а большие SD - более коротким пикам.
whuber
Большое спасибо за ваш ответ, имеет смысл. Таким образом, знание только пиковых значений в этом смысле довольно важно.
Фонон