Упорядочить статистику (например, минимум) бесконечного набора переменных хи-квадрат?

11

Это мой первый раз здесь, поэтому, пожалуйста, дайте мне знать, если я смогу уточнить свой вопрос каким-либо образом (включая форматирование, теги и т. Д.). (И, надеюсь, я смогу редактировать позже!) Я пытался найти ссылки и пытался решить сам, используя индукцию, но потерпел неудачу в обоих случаях.

Я пытаюсь упростить распределение, которое, кажется, сводит к статистике порядка счетного бесконечного набора независимых случайных величин с различными степенями свободы; в частности, каково распределение го наименьшего значения среди независимых ?χ2mχ22,χ42,χ62,χ82,

Я был бы заинтересован в особом случае : каково распределение минимума (независимых) ?m=1χ22,χ42,χ62,

Для случая минимума я смог написать интегральную функцию распределения (CDF) как бесконечный продукт, но не могу упростить ее дальше. Я использовал тот факт, что CDF имеет вид (При это подтверждает второй комментарий ниже об эквивалентности с экспоненциальным распределением с ожиданием 2.) Тогда CDF минимума можно записать как Первый член в произведении - это просто , а «последний» - это F 2 m ( x ) = γ ( m , x / 2 ) / Γ ( m ) = γ ( m , x / 2 ) / ( m - 1 ) ! = 1 - е - х / 2 м - 1 к ! ) . м = 1 ф мχ2m2

F2m(x)=γ(m,x/2)/Γ(m)=γ(m,x/2)/(m1)!=1ex/2k=0m1xk/(2kk!).
m=1
Fmin(x)=1(1F2(x))(1F4(x))=1m=1(1F2m(x))
е-х/2е-х/2Е к = 0 хк/(2кк!)=1
=1m=1(ex/2k=0m1xk2kk!).
ex/2ex/2k=0xk/(2kk!)=1 . Но я не знаю, как (если это возможно?) Упростить это оттуда. Или, может быть, совершенно другой подход лучше.

Другое потенциально полезное напоминание: - это то же самое, что и экспоненциальное распределение с ожиданием 2, а - это сумма двух таких экспонент и т. Д. χ 2 4χ22χ42

Если кому-то интересно, я пытаюсь упростить теорему 1 в этой статье для случая регрессии по константе ( для всех ). (У меня есть вместо так как я умножил на .)i χ 2 Γ 2 κxi=1iχ2Γ2κ

Дэвид М Каплан
источник
Имеет ли это ответ на ваш вопрос?
mpiktas
χ22χ42,χ62,
1
Xkλ/2k=1,2,1Fmin(λ)Xkk
1
T1,T2,Exp(1/2)i )N(t):=sup{n:i=1nTit}1/2U1=T1U2=T2+T3U3=T4+T5+T6Uiχ2i2являются независимыми и благодаря стационарному свойству независимых приращений пуассоновского процесса имеем . P(Uit)=P(N(t)i)
кардинал
@Cardinal Конечно, это хороший способ увидеть это. Любопытство не в отношениях между Пуассоном и Гаммой; оно заключается в описании самого события!
whuber

Ответы:

8

Нули бесконечного произведения будут объединением нулей слагаемых. Вычисление до 20-го семестра показывает общую закономерность:

участок сложных нулей

Этот график нулей в комплексной плоскости различает вклад отдельных членов в произведение с помощью различных символов: на каждом шаге кажущиеся кривые расширяются еще дальше, а новая кривая начинается еще левее.

Сложность этой картины демонстрирует, что не существует решения в замкнутой форме с точки зрения хорошо известных функций высшего анализа (таких как гамма, тэты, гипергеометрические функции и т. Д.), А также элементарных функций, которые рассматриваются в классическом тексте, таком как Уиттекер. И Уотсон ).

Таким образом, проблема может быть более плодотворно сформулирована немного по-другому : что вам нужно знать о распределении статистики заказов? Оценки их характерных функций? Моменты низкого порядка? Приближения к квантилям? Что-то другое?

Whuber
источник
Почему нули продукта важны? Я чувствую, что упускаю что-то тривиальное.
mpiktas
2
@mp Нули и полюсы показывают кое-что о сложности функции. Рациональные функции имеют конечное число из них. Элементарные функции обычно имеют строку нулей, например, при , интеграл для ; типичные «трансцендентные» функции имеют несколько более сложные паттерны нулей, например, у всех неположительных целых чисел (обратных к гамма-функции) или на решетке точек (тета-функции и эллиптические функции). Сложный образец, представленный здесь, предполагает, что будет трудно или невозможно выразить CDF в терминах этих знакомых функций. 2iπnnexp()
whuber
2
@whuber (1/2), спасибо! Я не знал о различных классах функций, имеющих эти различные структуры нулей в комплексной плоскости; это звучит очень полезно, и ваш график, кажется, отвечает на мой вопрос (как изложено).
Дэвид М Каплан
@whuber (2/2), это проверял особый случай (сложного) распределения оценки, приведенной в другой статье. Они использовали существование дистрибутива, чтобы оправдать использование начальной загрузки; Мой советник предложил мне приблизиться к распределению. Кажется, что их распространение может быть отключено для этого особого случая (где я знаю, что это должно быть), поэтому я проверю с моим консультантом после его крайнего срока предоставления гранта; но, возможно, я бы попытался взять расширение порядка го порядка более высокого порядка (деленное на ) как , в более сложной ситуации. Опубликуем еще раз, если так; еще раз спасибо! mmm
Дэвид М Каплан
4

Каково распределение минимума (независимых) ?χ22,χ42,χ62,

Извиняюсь за опоздание примерно на 6 лет. Несмотря на то, что ФП, вероятно, перешел к другим проблемам, вопрос остается свежим, и я подумал, что мог бы предложить другой подход.


Нам даны где где с pdf :(X1,X2,X3,)XiChisquared(vi)vi=2ifi(xi)

введите описание изображения здесь

Вот график соответствующего pdf при увеличении размера выборки для :i = от 1  до  8fi(xi)i=1 to 8

введите описание изображения здесь

Нас интересует распределение .min(X1,X2,X3,)

Каждый раз, когда мы добавляем дополнительный термин, pdf предельного последнего добавленного термина смещается все дальше и дальше вправо, так что эффект от добавления все большего и большего количества терминов становится не только все менее и менее актуальным, но после нескольких терминов , становится практически незначительным - на минимуме выборки. По сути, это означает, что только очень небольшое количество терминов, вероятно, действительно имеет значение ... и добавление дополнительных терминов (или наличие бесконечного числа терминов) в значительной степени не имеет значения для проблемы минимума выборки.

Тест

Чтобы проверить это, я вычислил pdf из в 1 термин, 2 условия, 3 условия, 4 условия, 5 условий, 6 условий, 7 условий, 8 условий, до 9 сроков и до 10 сроков. Для этого я использовал функцию из mathStatica , указав ее здесь для вычисления pdf минимума выборки ( порядка порядка ) в выборке размера и где параметр (вместо этого) быть исправленным) :1 - й J я v яmin(X1,X2,X3,)OrderStatNonIdentical1stjivi

введите описание изображения здесь введите описание изображения здесь

Это становится немного сложнее, так как количество терминов увеличивается ... но я показал вывод для 1 термина (1-я строка), 2 терминов (вторая строка), 3 терминов (3-я строка) и 4 терминов выше.

На следующей диаграмме сравнивается pdf образца минимума с 1 термином (синий), 2 терминами (оранжевый), 3 терминами и 10 терминами (красный). Обратите внимание, насколько похожи результаты только с 3 терминами против 10 терминов: введите описание изображения здесь

На следующей диаграмме сравниваются 5 терминов (синий) и 10 (оранжевый). Графики очень похожи, они стирают друг друга, и разницы даже не видно:

введите описание изображения здесь

Другими словами, увеличение количества слагаемых с 5 до 10 практически не оказывает заметного визуального влияния на распределение минимума выборки.

Полулогистическая аппроксимация

Наконец, отличное простое приближение pdf образца min - это полу-логистическое распределение с pdf:

g(x)=2ex(ex+1)2 for x>0

На следующей диаграмме сравнивается точное решение с 10 терминами (которые неотличимы от 5 или 20 терминов) и полулогистическим приближением (пунктир):

введите описание изображения здесь

Увеличение до 20 сроков не делает никакой заметной разницы.

wolfies
источник