Существует ли примерная версия одностороннего чебышевского неравенства?

32

Меня интересует следующая односторонняя версия неравенства Чебышева Кантелли :

п(Икс-Е(Икс)T)Вaр(Икс)Вaр(Икс)+T2,

По сути, если вы знаете среднее значение и дисперсию населения, вы можете рассчитать верхнюю границу вероятности наблюдения определенного значения. (Это было мое понимание, по крайней мере.)

Однако я хотел бы использовать выборочное среднее значение и выборочную дисперсию вместо фактического среднего значения и дисперсии.

Я предполагаю, что, поскольку это внесет больше неопределенности, верхняя граница увеличится.

Существует ли неравенство, аналогичное приведенному выше, но которое использует выборочное среднее значение и дисперсию?

Редактировать : «Образец» аналог неравенства Чебышева (не односторонний), был разработан. На странице Википедии есть некоторые детали. Тем не менее, я не уверен, как это будет переводиться в односторонний случай, который я описал выше.

Casandra
источник
Спасибо Glen_b. Это довольно интересная проблема. Я всегда думал, что неравенство Чебышева было мощным (так как оно позволяет вам делать статистический вывод, не требуя распределения вероятностей); так что возможность использовать его со средним и дисперсией выборки была бы просто потрясающей.
Касандра

Ответы:

26

Да, мы можем получить аналогичный результат, используя среднее значение и дисперсию выборки, и, возможно, в процессе появятся пара небольших сюрпризов.

Во-первых, нам нужно немного уточнить формулировку вопроса и изложить несколько предположений. Важно отметить, что мы не можем надеяться заменить дисперсию совокупности дисперсией выборки в правой части, поскольку последняя случайна ! Итак, переориентируем наше внимание на эквивалентное неравенство В случае, если не ясно, что они эквивалентны, обратите внимание, что мы просто заменили t на t σ в исходном неравенстве без потери общности.

п(Икс-ЕИксTσ)11+T2,
TTσ

Во-вторых, мы предполагаем, что у нас есть случайный образец и нас интересует верхняя оценка для аналогичной величины PИкс1,...,ИксN , где ˉ X - среднее значение выборки, а S стандартное отклонение выборки.P(X1X¯tS)X¯S

Полшага вперед

Отметим, что уже применяя оригинальное одностороннее неравенство Чебышева к , мы получаем, что P(X1- ˉ Xtσ)1Икс1-Икс¯

п(Икс1-Икс¯Tσ)11+NN-1T2
где , что меньше, чем в правой части оригинальной версии. Это имеет смысл! Любая конкретная реализация случайной величины из выборки будет (немного) ближе к среднему значению выборки, в которое она вносит вклад, чем к среднему значению для популяции. Как мы увидим ниже, мы получим замену σ на S при еще более общих предположениях.σ2знак равноВaр(Икс1)σS

Примерный вариант одностороннего Чебышева

Утверждение : пусть - случайная выборка такая, что P ( S = 0 ) = 0Икс1,...,ИксNп(Sзнак равно0)знак равно0 . Тогда В частности, примерная версия границыболее жесткая,чем исходная популяционная версия.

п(Икс1-Икс¯TS)11+NN-1T2,

Примечание : мы не предполагаем, что имеет либо конечное среднее значение, либо дисперсию!Икся

Доказательство . Идея состоит в том, чтобы адаптировать доказательство первоначального одностороннего неравенства Чебышева и использовать симметрию в процессе. Во-первых, установите для удобства обозначения. Затем заметим, что P ( Y 1t S ) = 1Yязнак равноИкся-Икс¯

п(Y1TS)знак равно1NΣязнак равно1Nп(YяTS)знак равноЕ1NΣязнак равно1N1(YяTS),

Теперь, для любого , на { S > 0 } , 1 ( Y ят S ) = 1 ( Y я + т с S T S ( 1 + гр ) )1 ( ( Y яс>0{S>0}

1(YяTS)знак равно1(Yя+TсSTS(1+с))1((Yя+TсS)2T2(1+с)2S2)(Yя+TсS)2T2(1+с)2S2,

Тогда поскольку ˉ Y = 0 иi Y 2

1ni1(YяTS)1NΣя(Yя+TсS)2T2(1+с)2S2знак равно(N-1)S2+NT2с2S2NT2(1+с)2S2знак равно(N-1)+NT2с2NT2(1+с)2,
Y¯знак равно0.iYi2=(n1)S2

Правая часть является константой ( ! ), Поэтому при ожидании с обеих сторон получаем Наконец, минимизируя по c , получаем c = n - 1

P(X1X¯tS)(n1)+nt2c2nt2(1+c)2.
c , который после небольшой алгебры устанавливает результат.c=n1nt2

Это надоедливое техническое состояние

P(S=0)=0S20=Yi=tS=0it>0

Мы можем пошевелиться, установив q=P(S=0)

q=P(S=0)>0

P(X1X¯tS)(1q)11+nn1t2+q.

{S>0}{S=0}{S>0}{S=0}

Несколько более чистое неравенство получается, если мы заменим нестрогое неравенство в утверждении вероятности строгой версией.

q=P(S=0)

P(X1X¯>tS)(1q)11+nn1t2.

X (кроме того, что она не была почти наверняка постоянной в случае нестрого неравенства, которое первоначальная версия также подразумевает), по сути, потому что выборочное среднее и выборочная дисперсия всегда существуют независимо от того, существуют ли их популяционные аналоги.

кардинальный
источник
15

NИкся

Икся-Икс¯<sN-1,язнак равно1,,,,N
ssзнак равно(1NΣязнак равно1N(Икся-Икс¯)2)1/2,

Затем, используя обозначение ответа кардинала, мы можем утверждать, что

п(Икс1-Икс¯SN-1)знак равно0a,s,[1]

Поскольку нам требуются три различных значения, мы будем иметь S0по предположению. Итак, постановкаTзнак равноN-1 в неравенстве кардинала (начальная версия) получаем

P(X1X¯Sn1)11+n,[2]

Eq. [2] is of course compatible with eq. [1]. The combination of the two tells us that Cardinal's Inequality is useful as a probabilistic statement for 0<t<n1.

If Cardinal's Inequality requires S to be calculated bias-corrected (call this S~) then the equations become

P(X1X¯S~n1n)=0a.s.[1a]

and we choose t=n1n to obtain through Cardinal's Inequality

P(X1X¯S~n1n)1n,[2a]
and the probabilistically meaningful interval for t is 0<t<n1n.
Alecos Papadopoulos
источник
2
(+1) Кстати, как я впервые рассматривал эту проблему, тот факт, что Максимумя|Икся-Икс¯|SN-1был фактически начальный признак того, что выборочное неравенство должно быть более жестким, чем оригинал. Я хотел втиснуть это в свой пост, но не мог найти (удобное) место для этого. Я рад, что вы упомянули об этом (на самом деле очень небольшое улучшение) здесь вместе с вашей очень хорошей дополнительной проработкой. Приветствия.
кардинал
Cheers @Cardinal, great answer -just clarify for me -does it matter for your Inequality how one defines the sample variance (bias-corrected or not)?
Алекос Пападопулос
Только очень немного. Я использовал отклонение выборки с поправкой на смещение. Если вы используетеN вместо того N-1 нормализовать, то вы в конечном итоге
1+T2с2T2(1+с)2
вместо того
(N-1)+NT2с2NT2(1+с)2,
что означает N/(N-1)срок в окончательном неравенстве исчезнет. Таким образом, вы получите ту же оценку, что и в исходном одностороннем чебышевском неравенстве в этом случае. (Предполагая, что я правильно выполнил алгебру.) :-)
кардинал
@Cardinal ...which means that the relevant equations in my answer are 1a and 2a, which means that your inequality tells us that for t chosen to activate Samuelson Inequality, the probability of the event we are examining, cannot be greater than 1/n, i.e. not greater than randomly choosing any one realized value from the sample... which somehow makes some hazy intuitive sense: what is proven certainly impossible in deterministic terms, when approached probabilistically its probability bound does not exceed equiprobability... not clear in my mind yet.
Алекос Пападопулос