Что это за хитрость с добавлением 1 здесь?

11

Я смотрел на эту страницу о реализации Монте-Карло теста Лиллефорса. Я не понимаю это предложение:

В этом расчете из моделирования есть случайная ошибка. Однако из-за хитрости добавления 1 к числителю и знаменателю при вычислении значения P его можно использовать прямо, без учета случайности.

Что они подразумевают под хитростью добавления 1 к числителю и знаменателю?

Соответствующий фрагмент кода находится здесь:

n <- length(x)
nsim <- 4999
d.star <- double(nsim)
for (i in 1:nsim) {
    x.star <- rnorm(n)
    d.star[i] <- fred(x.star)
}
hist(d.star)
abline(v = d.hat, lty = 2)
## simulation-derived P-value
pval <- (sum(d.star > d.hat) + 1) / (nsim + 1)
Аксакал
источник
Можете ли вы добавить соответствующий контекст здесь?
gung - Восстановить Монику
4
Выглядит как сглаживание Лапласа для оценки вероятностей по методу Монте-Карло, которая сужает его до 1/2; Основной эффект, вероятно, состоит в том, чтобы избежать получения значения p, равного 0, как заметил @Tim (хотя нет риска деления на 0, как он сказал, если вы не выполняете 0 симуляций). Я действительно не понимаю, почему это позволяет вам использовать его "без учета случайности", хотя.
Дугал
2
Вы написали Geyer непосредственно, чтобы спросить, что означает предложение?
Алексис
@ Алексис, нет, но это хорошая идея.
Аксакал
@ Даугал, да, это похоже на сглаживание Лапласа. Непонятно, почему он применяет это здесь.
Аксакал

Ответы:

6

Объяснение на указанной странице

Согласно нулевой гипотезе вероятность в точности равна если принять во внимание как случайность в данных, так и случайность в симуляции.k / n simPr(Pk/nsim)k/nsim

Чтобы понять это, мы должны взглянуть на код, ключевые строки которого (значительно сокращены)

fred <- function(x) {ks.test(...)$statistic}  # Apply a statistical test to an array
d.hat <- fred(x)                              # Apply the test to the data
d.star <- apply(matrix(rnorm(n*nsim), n, nsim),
                2, fred)                      # Apply the test to nsim simulated datasets
pval <- (sum(d.star > d.hat) + 1) / (nsim + 1)# Estimate a simulation p-value

Существенная проблема заключается в том, что код не соответствует кавычке. Как мы можем примирить их? Одна попытка начинается со второй половины цитаты. Мы можем интерпретировать процедуру как включающую следующие шаги:

  1. Collect независимо друг от друга и одинаково распределенные данные согласно некоторому вероятностному закону . Примените тестовую процедуру (реализованную в коде как ), чтобы получить число . G t T 0 = t ( X 1 , , X n )X1,X2,,XnGtfredT0=t(X1,,Xn)

  2. Сформировать с помощью компьютера сравнимых наборов данных, каждый из размера , в соответствии с нулевой гипотезой с вероятностью закона . Примените к каждому такому набору данных, чтобы получить чисел . n F t N T 1 , T 2 , , T NN=nsimnFtNT1,T2,,TN

  3. Вычислить

    P=(i=1NI(Ti>T0)+1)/(N+1).

    (« » - это индикаторная функция, реализованная посредством векторного сравнения в коде.) Правая часть понимается как случайная в силу одновременной случайности (фактической статистики теста) и случайности ( смоделированная тестовая статистика). т 0 т яId.star > d.hatT0Ti

Для того, чтобы сказать , что данные соответствуют нулевой гипотезы является утверждение , что . Выберите размер теста , . Умножение обеих сторон на и вычитание показывает, что вероятность того, что для любого числа - это вероятность того, что не более из превысит . Это говорит лишь о том, что находится в верхней части отсортированного набора всей статистики испытаний . Так как (по конструкции)α 0 < α < 1 N + 1 1 P α α ( N + 1 ) α - 1 T i T 0 T 0 ( N + 1 ) α N + 1 T 0 T i F ( N + 1 ) α Pr ( P α ) = F=Gα0<α<1N+11Pαα(N+1)α1TiT0T0(N+1)αN+1T0не зависит от всех , когда - непрерывное распределение, этот шанс будет частью общего числа, представленного целой частью ; то есть и он будет точно равен ему при условии - целое число ; то есть когда .TiF(N+1)α(N+1)& alphaк& alpha=K/(N+1)

Pr(Pα)=(N+1)αN+1α
(N+1)αkα=k/(N+1)

Это, безусловно, одна из вещей, которые мы хотим быть верными для любой величины, которая заслуживает того, чтобы называться «p-значением»: она должна иметь равномерное распределение на . При условии, что достаточно велико, так что любая близка к некоторой доле формы , эта будет близка к равномерной распределение. (Чтобы узнать о дополнительных условиях, необходимых для p-значения, прочитайте диалог, который я разместил на тему p-значений. )N + 1 α k / ( N + 1 ) = k / ( n sim + 1 ) P[0,1]N+1αК/(N+1)знак равноК/(Nсим+1)п

Очевидно, что цитата должна использовать « » вместо « », где бы он ни появлялся.n simNсим+1Nсим

Whuber
источник
5

Я считаю, что здесь 1 добавляется к обоим, потому что наблюдаемая статистика включена в эталонное распределение; если это так, то это из-за «хотя бы такой большой» части определения p-значения.

Я не знаю наверняка, потому что текст, кажется, говорит что-то другое, но именно поэтому я бы сделал это.

Glen_b - Восстановить Монику
источник
1
@ whuber Я не понимаю, как я могу согласиться. Не все тесты являются тестами отношения правдоподобия; когда они не являются LRT, какую значимость можно интерпретировать с точки зрения отношения правдоподобия?
Glen_b
1
@whuber Это, безусловно, может сделать. Но рассмотрим, к примеру, Уилкоксон-Манн-Уитни (или, действительно, тесты перестановок более широко). Существует широкое применение совершенно разумных тестов, которые не являются ни тестом Лилифорса, ни тестом отношения правдоподобия. Когда есть четкая альтернатива, в зависимости от того, какая мощность желательна, часто можно построить значимую статистику теста, где упорядочение в пространстве выборки, заданное статистикой теста, имеет смысл и имеет разумные свойства в широком диапазоне альтернатив.
Glen_b
1
Разумеется, при разработке тестовой статистики, которая соответствует (в смысле принятия более экстремальных значений, больших, меньших или обоих) интересующему типу альтернативы, вы обращаетесь к «виду альтернативы, интересующемуся «- но даже если бы кто-то использовал недопустимый (даже бесполезный тест), принцип, который я изложил в своем ответе о включении наблюдаемой выборки в смоделированные результаты, все равно будет применяться. Если у вас есть порядок, даже если он не самый лучший, при расчете p-значений наблюдаемый случай все равно будет принадлежать счету.
Glen_b
2
@whuber мы не можем быть так далеко друг от друга сейчас. При выборе разумной тестовой статистики мы, безусловно, хотели бы обратиться к чему-то . Но как только у нас есть тестовая статистика (как мы должны иметь к моменту, когда мы моделируем под нулевым значением), мы уже сделали это. И как только мы это сделаем, причина, по которой мы бы включили наблюдаемый случай в наш расчет p-значения, заключается в том, что такое p-значение.
Glen_b
1
Я не думаю, что у нас вообще есть какие-либо различия. (Обратите внимание, что мой собственный ответ дает понять, что включение наблюдаемой выборки в число является уместным.) Мой комментарий был направлен не на ваш ответ на вопрос (с которым я согласен и проголосовал), а только на проблемную фразу «по крайней мере» как большой. " Я вижу эту фразу неправильно во многих местах на этом сайте (и в других местах), что я хотел привлечь внимание читателей к тому, что это должно действительно означать.
whuber