Решение к упражнению 2.2a.16 «Надежная статистика: подход, основанный на функциях влияния»

9

На странице 180 Робастной статистики: подход, основанный на функциях влияния, можно найти следующий вопрос:

  • 16: Показать, что для инвариантных по местоположению оценок всегда . Найдите соответствующую верхнюю границу для точки развала конечной выборки , причем в случае, когда нечетно или четно.ε12εnnn

Вторая часть (после периода) на самом деле тривиальна (учитывая первую), но я не могу найти способ доказать первую часть (предложение) вопроса.

В разделе книги, касающемся этого вопроса, можно найти (стр. 98):

Определение 2: точка развала конечной выборки оценки в выборке определяется как:εnTn(xl,,xn)

εn(Tn;xi,,xn):=1nmax{m:maxi1,,imsupy1,,ym|Tn(z1,,zn)|<}

где выборка (z1,,zn) получается путем замены m точек данных xi1,,xim произвольными значениями y1,,ym.

Формальное определение само по себе работает почти для страницы, но его можно рассматривать как Хотя однозначно не определено, одно может предположить, что инвариант местоположения означает, что должен удовлетворять ε

ε=limnεn
Tn
Tn(x1,,xn)=Tn(x1+c,,xn+c), for all cR

Я (пытаюсь) ответить на вопрос Вубера в комментарии ниже. Книга определяет оценку в несколько страниц, начиная с p82, я пытаюсь воспроизвести основные части (я думаю, что это ответит на вопрос Уубера):Tn

Предположим, у нас есть одномерные наблюдения которые независимы и одинаково распределены (iid). Наблюдения принадлежат некоторому выборочному пространству , которое является подмножеством вещественной линии (часто просто равно самому , поэтому наблюдения могут принимать любое значение ). Параметрическая модель состоит из семейства вероятностных распределений на выборочном пространстве, где неизвестный параметр принадлежит некоторому пространству параметров(X1,,Xn)HRHRFθθΘ

...

Мы отождествляем выборку с ее эмпирическим распределением , игнорируя последовательность наблюдений (как это почти всегда делается). Формально , задается , где , является точечная масса 1 в . В качестве оценки мы рассматриваем вещественную статистику . В более широком смысле оценщик можно рассматривать как последовательность статистики , по одной для каждого возможного размера выборки . В идеале, наблюдения должны проводиться в соответствии с членом параметрической модели (X1,,Xn)GnGn(1/n)i=1nΔxiΔXXθTn=Tn(X1,,Xn)=Tn(Gn){Tn,n1}n{Fθ;θΘ} , но класс всех возможных распределений вероятностей на намного больше.F(H)H

Мы рассматриваем оценки, которые являются функционалами [т.е. для всех и ] или могут асимптотически заменяться функционалами. Это означает, что мы предполагаем, что существует функционал [где домен - это множество всех распределений для которого определен ], такой что в вероятности, когда наблюдения находятся в соответствии с истинным распределением в . Мы говорим, чтоTn(Gn)=T(Gn)nGnT:domain(T)RTF(H)T

Tn(X1,,Xn)nT(G)
Gdomain(T)T(G)это асимптотическое значение на .{Tn;n1}G

...

В этой главе мы всегда предполагаем, что изучаемые функционалы согласованы по Фишеру (Kallianpur and Rao, 1955): что означает, что в модель оценщик асимптотически измеряет правильную величину. Понятие согласованности Фишера более подходит и элегантно для функционалов, чем обычная согласованность или асимптотическая непредвзятость.

T(Fθ)=θ for all θΘ
{Tn;n1}

user603
источник
1
Как именно эта книга определяет «оценщик»? Мне кажется, что любой ограниченный оценщик должен иметь точку развала , поэтому он, безусловно, накладывает какие-то особые ограничения на ; и всегда существуют ограниченные локально-инвариантные оценки (они будут включать константы). Tn1Tn
whuber
1
Спасибо за расширенный материал. Кажется, что существует множество контрпримеров. Простым является оценка константы для однопараметрического семейства нормальных распределений дисперсии . Это локально-инвариантная оценка дисперсии. Его точка развала равна . Это Фишер-непротиворечиво (тривиально), но мне нужно тщательно интерпретировать определение: « » не может обязательно ссылаться на все параметры, потому что тогда никакая инвариантная по местоположению оценка не может быть непротиворечивой! Tn(X1,,Xn)=111θ
whuber
@whuber: Спасибо, я понимаю ваш контрпример. Я думаю, что я
свяжусь

Ответы:

4

В старых книгах по статистике «инвариант» использовался немного иначе, чем можно было ожидать; неоднозначная терминология сохраняется. Более современный эквивалент - «эквивариантный» (см. Ссылки в конце этого поста). В настоящем контексте это означает

Tn(X1+c,X2+c,,Xn+c)=Tn(X1,X2,,Xn)+c

для всех реальных .c

Тогда для решения вопроса предположим, что обладает свойством, что для достаточно большого , всех вещественных и всех ,Tnncmεn

|Tn(X+Y)Tn(X)|=o(|c|)

всякий раз , когда отличается от не более не более чем в координат.YXcm

(Это более слабое условие, чем предполагалось в определении границы разбивки. Фактически, все, что нам действительно нужно предположить, это то, что когда достаточно велико, выражение « » является некоторым значением, которое гарантированно будет меньше в размере.)no(|c|)|c|/2

Доказательство от противного. Соответственно, предположим, что этот также эквивариантен, и предположим, что . Тогда при достаточно больших , представляет собой целое число , по которому оба и . Для любых действительных чисел определимTnε>1/2nm(n)=εnm(n)/nε(nm(n))/nεa,b

tn(a,b)=Tn(a,a,,a, b,b,,b)

где есть 's и ' s. Изменяя или меньше координат, мы заключаем обаm(n) anm(n) bm(n)

|t(a,b)t(0,b)|=o(|a|)

а также

|t(a,b)t(a,0)|=o(|b|).

При неравенство треугольника утверждаетc>0

c=|tn(c,c)tn(0,0)||tn(c,c)tn(c,0)|+|tn(c,0)tn(0,0)|=o(c)+o(c)<c/2+c/2=c

Строгое неравенство на предпоследней линии обеспечивается при достаточно большом . Противоречие, которое оно подразумевает, , доказываетnc<cε1/2.


Ссылки

Е. Л. Леманн, Теория точечного оценивания . Джон Вили 1983

В тексте (глава 3, раздел 1) и сопроводительной сноске Леманн пишет

Оценщик, удовлетворяющий для всех будет называться эквивариантным ...δ(X1+a,,Xn+a)=δ(X1,,Xn)+aa

Некоторые авторы называют такие оценки «инвариантными». Поскольку это предполагает, что оценка остается неизменной при , представляется предпочтительным зарезервировать этот член для функций, удовлетворяющих для всех .Xi=Xi+au(x+a)=u(x)x,a

Whuber
источник
1
да, я связался вчера с основным автором книги с тем же вопросом о действительном определении инвариантности (я посмотрел в указателе и не смог найти его явным образом в книге). Я проголосовал, потому что я думаю, что ваш ответ правильный, но даст автору пару дней, чтобы быть уверенным, прежде чем принять его.
user603
1
Я не получил ответа от автора, но приведенные выше аргументы (в ответе и комментарии) убедили меня, что это действительно должно быть правильное толкование проблемы.
user603