Пусть обозначает медиану, а обозначает среднее случайной выборки размером из распределения . Как я могу вычислить ?Y ˉ X n = 2 k + 1 N ( μ , σ 2 ) E ( Y | ˉ X = ˉ x )
Интуитивно понятно, что из предположения о нормальности имеет смысл утверждать, что и это действительно правильный ответ. Может ли это быть строго показано, хотя?E ( Y | ˉ X = ˉ x ) = ˉ x
Моя первоначальная мысль состояла в том, чтобы подойти к этой проблеме, используя условное нормальное распределение, которое обычно является известным результатом. Проблема в том, что, поскольку я не знаю ожидаемого значения и, следовательно, дисперсии медианы, мне придется вычислять те, которые используют статистику к + 1
Ответы:
Пусть обозначают исходный образец и случайный вектор с элементами . Тогда является нормальным центрированием (но его записи не являются независимыми, как видно из того факта, что их сумма равна нулю с полной вероятностью). Как линейный функционал , вектор является нормальным , следовательно , вычисление его ковариационной матрицы достаточно показать , что не зависит от .XX ZZ Zk=Xk−ˉXZk=Xk−X¯ ZZ XX (Z,ˉX)(Z,X¯) ZZ ˉXX¯
Обращаясь к , можно видеть , что , где является медианой . В частности, зависит от только потому, что не зависит от , а распределение симметрично, поэтому центрирована.YY Y=ˉX+TY=X¯+T TT ZZ TT ZZ TT ˉXX¯ ZZ TT
Наконец,E(Y∣ˉX)=ˉX+E(T∣ˉX)=ˉX+E(T)=ˉX.
источник
Медиана выборки является статистикой порядка и имеет ненормальное распределение, поэтому совместное распределение конечной выборки медианы выборки и среднего значения выборки (которое имеет нормальное распределение) не будет бивариантным нормальным. Приближаясь к приближениям, асимптотически справедливо следующее (см. Мой ответ здесь ):
√n [ ( ˉ X n Y n ) - ( μ v ) ] → LN [ ( 0 0 ) , Σ ]
с
Σ = ( σ 2 E ( | X - v | ) [ 2 f ( v ) ] - 1 E ( | X - v | ) [ 2 f ( v ) ] - 1 [ 2 f ( v ) ] - 2 )
где ˉ Х п является выборочное среднее и ц среднее популяции, У п является образцом Медиана и v медиана населения, F ( ) есть плотность вероятности случайных величин , участвующих и σ 2 является дисперсией.X¯n μ Yn v f() σ2
Таким образом, примерно для больших выборок их совместное распределение является двумерным нормальным, поэтому мы имеем
Е ( У п | ˉ Х п = ˉ х ) = v + р сг vσ ˉ X ( ˉ x -μ)
где ρ - коэффициент корреляции.ρ
Манипулируя асимптотическим распределением, чтобы оно стало приближенным распределением для большой выборки среднего значения выборки и медианы выборки (а не стандартизированных величин), мы имеем ρ = 1n E(|X-v|)[2f(v)]-11n σ[2f(v)]-1=E(|X-v|)σ
Таким образом , E ( Y п | ˉ X п = ˉ х ) = v + E ( | X - v | )σ [ 2 f ( v ) ] - 1σ ( ˉ x -μ)
Мы имеем, что 2 f ( v ) = 2 / σ √2 π из-за симметрии нормальной плотности, поэтому мы приходим к2f(v)=2/σ2π−−√
E(Yn∣ˉXn=ˉx)=v+√π2E(|X−μσ|)(ˉx−μ)
where we have used v=μv=μ . Now the standardized variable is a standard normal, so its absolute value is a half-normal distribution with expected value equal to √2/π2/π−−−√ (since the underlying variance is unity). So
E(Yn∣ˉXn=ˉx)=v+√π2√2π(ˉx−μ)=v+ˉx−μ=ˉx
источник
The answer is ˉxx¯ .
Let x=(x1,x2,…,xn)x=(x1,x2,…,xn) have a multivariate distribution FF for which all the marginals are symmetric about a common value μμ . (It does not matter whether they are independent or even are identically distributed.) Define ˉxx¯ to be the arithmetic mean of the xi,xi, ˉx=(x1+x2+⋯+xn)/nx¯=(x1+x2+⋯+xn)/n and write x−ˉx=(x1−ˉx,x2−ˉx,…,xn−ˉx)x−x¯=(x1−x¯,x2−x¯,…,xn−x¯) for the vector of residuals. The symmetry assumption on FF implies the distribution of x−ˉxx−x¯ is symmetric about 00 ; that is, when E⊂RnE⊂Rn is any event,
PrF(x−ˉx∈E)=PrF(x−ˉx∈−E).
Applying the generalized result at /stats//a/83887 shows that the median of x−ˉxx−x¯ has a symmetric distribution about 00 . Assuming its expectation exists (which is certainly the case when the marginal distributions of the xixi are Normal), that expectation has to be 00 (because the symmetry implies it equals its own negative).
Now since subtracting the same value ˉxx¯ from each of a set of values does not change their order, YY (the median of the xixi ) equals ˉxx¯ plus the median of x−ˉxx−x¯ . Consequently its expectation conditional on ˉxx¯ equals the expectation of x−ˉxx−x¯ conditional on ˉxx¯ , plus E(ˉx | ˉx)E(x¯ | x¯) . The latter obviously is ˉxx¯ whereas the former is 00 because the unconditional expectation is 00 . Their sum is ˉx,x¯, QED.
источник
This is simpler than the above answers make it. The sample mean is a complete and sufficient statistic (when the variance is known, but our results do not depend on the variance, hence will be valid also in the situation when the variance is unknown). Then the Rao-Blackwell together with the Lehmann-Scheffe theorems (see wikipedia ...) will imply that the conditional expectation of the median, given the arithmetic mean, is the unique minimum variance unbiased estimator of the expectation μ. But we know that is the arithmetic mean, hence the result follows.
We did also use that the median is an unbiased estimator, which follows from symmetry.
источник