Еще один центральный вопрос о предельной теореме

11

Пусть - последовательность независимых случайных величин Бернулли с Установите Покажите, что сходится по распределению к стандартной нормальной переменной при стремлении к бесконечности.{Xn:n1}

P{Xk=1}=1P{Xk=0}=1k.
Sn=k=1n(Xk1k), Bn2=k=1nk1k2
SnBnZn

Я пытаюсь использовать CLT Ляпунова, поэтому нам нужно показать, что существует такой , что δ>0

limn1Bn2+δk=1nE[|Xk1k|2+δ]=0.

Поэтому установите δ=1

k=1nE|Xkk1|3=k=1n(1k3k2+4k32k4)
и
Bn3=(k=1n1k1k2)(k=1n1k1k2)

Оценивая большие n на компьютере, он показывает, как k=1nE|Xkk1|3 и Bn3 как n . Но Bn3 увеличивается быстрее, чем Bn2 поэтому k=1nE|Xkk1|3Bn30 . Может ли кто-нибудь помочь мне доказать, что это сближение верно?

TiffanyButterfly
источник
7
Это пример 27.3 вероятности и меры Патрика Биллингсли.
Zhanxiong

Ответы:

10

Может быть поучительно продемонстрировать этот результат из первых принципов и основных результатов , используя свойства производящих функции кумулянта (точно так же, как в стандартных доказательствах центральной предельной теоремы). Это требует от нас понимания скорости роста обобщенных гармонических чисел для Эти скорости роста хорошо известны и легко получаются путем сравнения с интегралами : они сходятся при и иначе расходятся логарифмически при .

H(n,s)=k=1nks
s=1,2,.1nxsdxs>1s=1

Пусть и . По определению производящая функция кумулянта (cgf) из равнаn21kn(Xk1/k)/Bn

ψk,n(t)=logE(exp(Xk1/kBnt))=tkBn+log(1+1+exp(t/Bn)k).

Последовательное разложение правой части, полученное из разложения вокруг , принимает видlog(1+z)z=0

ψk,n(t)=(k1)2k2Bn2t2+k23k+26k3Bn3t3++kj1±(j1)!j!kjBnjtj+.

Числители дробей являются полиномами от с начальным членом . Поскольку расширение журнала сходится абсолютно для , это расширение сходится абсолютно, когдаkkj1|1+exp(t/Bn)k|<1

|exp(t/Bn)1|<k.

(В случае, когда оно сходится повсюду.) При фиксированном и растущих значениях (очевидная) дивергенция означает, что область абсолютной сходимости растет сколь угодно большой. Таким образом, для любого фиксированного и достаточно большого это разложение абсолютно сходится.k=1knBntn

Таким образом, для достаточно большого , мы можем суммировать отдельного по терму по терму в степенях чтобы получить cgf для ,nψk,nktSn/Bn

ψn(t)=k=1nψk,n(t)=12t2++1Bnj(k=1n(k1±(j1)!kj))tjj+.

Взятие слагаемых в суммы по одному требует от нас оценки выражений, пропорциональныхk

b(s,j)=1Bnjk=1nks

для и . Используя асимптотику обобщенных гармонических чисел, упомянутых во введении, это легко следует изj3s=1,2,,j

Bn2=H(n,1)H(n,2)log(n)

это

b(1,j)(log(n))1j/20

и (для )s>1

b(s,j)(log(n))j/20

как растет большими. Следовательно, все члены в разложении за пределами сходятся к нулю, откуда сходится к для любого значения . Поскольку сходимость cgf подразумевает сходимость характеристической функции, из теоремы непрерывности Леви мы заключаем, что приближается к случайной переменной, cgf которой равна 2/2 : это стандартная переменная Normal, QED .nψn(t)t2ψn(t)t2/2tSn/Bnt2/2


Этот анализ раскрывает, насколько деликатна сходимость: тогда как во многих версиях центральной предельной теоремы коэффициент равен (для ), здесь коэффициент равен только : сходимость намного медленнее. В этом смысле последовательность стандартизированных переменных «едва-едва» становится нормальной.tjO(n1j/2)j3O(((log(n))1j/2)

Мы видим эту медленную сходимость в серии симуляций. Гистограммы отображают независимых итераций для четырех значений . Красные кривые представляют собой графики стандартных функций нормальной плотности для наглядности. Хотя, по-видимому, наблюдается постепенная тенденция к нормальности, даже при (где все еще значительно) остается заметная ненормальность, о чем свидетельствует асимметрия (равно в этом образце). (Не удивительно, что асимметрия этой гистограммы близка к , потому что это именно то, что является термином в cgf.)105nn=1000(log(n))1/20.380.35(log(n))1/2t3

Рисунок: гистограммы для n = 30, 100, 300, 1000

Вот Rкод для тех, кто хотел бы поэкспериментировать дальше.

set.seed(17)
par(mfrow=c(1,4))
n.iter <- 1e5
for(n in c(30, 100, 300, 1000)) {
  B.n <- sqrt(sum(rev((((1:n)-1) / (1:n)^2))))
  x <- matrix(rbinom(n*n.iter, 1, 1/(1:n)), nrow=n, byrow=FALSE)
  z <- colSums(x - 1/(1:n)) / B.n
  hist(z, main=paste("n =", n), freq=FALSE, ylim=c(0, 1/2))
  curve(dnorm(x), add=TRUE, col="Red", lwd=2)
}
Whuber
источник
6

У вас уже есть отличный ответ. Если вы также хотите заполнить собственное доказательство, вы можете утверждать следующее:

Поскольку сходится для всех и расходится для ( здесь ), мы можем написатьk=1n1/kii>1i=1

S(n):=k=1n(1k3k2+4k33k4)=k=1n1k+O(1).

По тому же аргументу,

Bn2=k=1n1k+O(1).

Следовательно, и, таким образом,S(n)/Bn2=O(1)

S(n)/Bn3=O(1)(Bn2)1/20,

это то, что мы хотели показать.

ekvall
источник
2

Во-первых, ваши случайные величины не распределены одинаково, если распределение зависит от ;)k

Также я бы не использовал вашу запись как:Bn

  • заглавные буквы обычно зарезервированы для случайных величин.
  • это просто сумма отклонений, поэтому я бы использовал обозначение, включающее символ чтобы сделать это очевидным.σ

Что касается вопроса, я не знаю, является ли это упражнение или исследование и какие инструменты вам разрешено использовать. Если вы не пытаетесь повторно доказать известные теоремы, я бы просто сказал, что это центральная предельная теорема для независимых неравномерно распределенных, но равномерно ограниченных RV, и назову это днем. У меня нет хорошего источника под рукой, но его не должно быть слишком сложно найти, например, посмотрите на /mathpro/29508/is-there-a-central-limit-theorem- для ограниченного-неидентично-распределенного-случайного .

Изменить: Мое плохо, конечно, равномерно ограниченное условие недостаточно, вам также нужно

k=1nσk2
Adrien
источник