Для некоторых тестов в R
, существует нижний предел на р-значение расчетов . Я не уверен, почему это число, если для этого есть веская причина или оно просто произвольно. Многие другие пакеты статистики просто идут 0.0001
, так что это намного более высокий уровень точности. Но я не видел слишком много статей отчетности или .
Является ли распространенной / лучшей практикой сообщать об этом вычисленном значении или более типично сообщать что-то еще (например p < 0.000000000000001
)?
...But I haven't seen too many papers reporting p<2.22⋅10−16....
См. Некоторые статьи GWAS , есть много работ, показывающих результаты для pvalues в сотнях, например: область KLK рака простаты, p = 9x10 ^ -186.Ответы:
Для этого есть веская причина.
Значение можно найти через
noquote(unlist(format(.Machine)))
Если вы посмотрите на помощь, (
?".Machine"
):По сути, это значение, ниже которого вы можете быть совершенно уверены, что это значение будет численно бессмысленным, поскольку любое меньшее значение вряд ли будет точным вычислением значения, которое мы пытались вычислить. (Изучив небольшой численный анализ, в зависимости от того, какие вычисления были выполнены конкретной процедурой, есть большая вероятность того, что численная бессмысленность будет выше этого.)
Но статистический смысл будет утерян гораздо раньше. Обратите внимание, что значения p зависят от допущений, и чем дальше в крайний хвост, тем сильнее на истинное значение p (а не на номинальное значение, которое мы рассчитываем) будут влиять ошибочные предположения, в некоторых случаях, даже если они только немного не правы. Поскольку предположения просто не будут полностью удовлетворены, средние p-значения могут быть достаточно точными (с точки зрения относительной точности, возможно, лишь незначительной доли), но чрезвычайно малые p-значения могут отсутствовать во многих порядках величина.
То есть обычная практика (что-то вроде «<0,0001», которое, как вы говорите, распространена в пакетах, или правило APA, которое Jaap упоминает в своем ответе), вероятно, не так далека от разумной практики, но является приблизительной точкой, в которой вещи потерять смысл, не говоря «очень-очень мало », конечно, будет сильно зависеть от обстоятельств.
Это одна из причин, по которой я не могу предложить общее правило - не может быть единого правила, которое хотя бы отдаленно подходит для всех при любых обстоятельствах, - немного измените обстоятельства, а широкая серая линия, обозначающая изменение от несколько значимого до относительно бессмысленно изменится, иногда далеко.
Если бы вы указали достаточную информацию о точных обстоятельствах (например, это регрессия с такой большой нелинейностью, это количество вариаций в этой независимой переменной, этот вид и степень зависимости в выражении ошибки, такого рода и степень гетероскедастичности, это форма распределения ошибок), я мог бы смоделировать «истинные» p-значения, чтобы вы могли сравнить их с номинальными p-значениями, чтобы вы могли видеть, когда они были слишком различны для номинального значения, чтобы нести какой-либо смысл.
Но это приводит нас ко второй причине, почему - даже если вы указали достаточно информации для имитации истинных p-значений - я все равно не смог бы ответственно заявить об ограничении даже для этих обстоятельств.
В отсутствие знаний об их предпочтительных функциях и правилах, а также в отсутствие знаний о ваших собственных утилитах, как я могу ответственно предлагать какой-либо общий выбор действий, которые следует предпринять?
Я могу, по крайней мере, рассказать вам о том, что я делаю (и я не думаю, что это хороший выбор для вас):
Это, безусловно, полезно для информирования о выборе - но я с такой же вероятностью буду обсуждать результаты моделирования, чтобы использовать их для выбора предельного значения, предоставляя другим возможность выбирать свои собственные.
Альтернативой симуляции является рассмотрение некоторых процедур, которые более устойчивы * к различным потенциальным ошибкам предположения, и посмотрите, как сильно может измениться значение p. Их p-значения также не будут особенно значимыми, но они, по крайней мере, дают некоторое представление о том, какое влияние это может оказать. Если некоторые из них сильно отличаются от номинальных, это также дает больше представления о том, какие нарушения допущений для исследования воздействия. Даже если вы не сообщите о какой-либо из этих альтернатив, это дает более полную картину того, насколько значимым является ваше маленькое значение p.
* Обратите внимание, что здесь нам не нужны процедуры, которые были бы устойчивы к грубым нарушениям некоторых предположений; те, которые менее подвержены относительно умеренным отклонениям соответствующего предположения, должны подойти для этого упражнения.
Я скажу, что когда / если вы приходите делать такое моделирование, даже с довольно легкими нарушениями, в некоторых случаях может быть удивительно, насколько далеко даже не такие маленькие p-значения могут быть неправильными. Это сделало больше, чтобы изменить способ, которым я лично интерпретирую значение p, больше, чем оно изменило конкретные ограничения, которые я мог бы использовать.
При отправке результатов проверки фактической гипотезы в журнал я пытаюсь выяснить, есть ли у них какое-либо правило. Если они этого не делают, я склонен угождать себе, а затем ждать, пока судьи будут жаловаться.
источник
То, что является обычной практикой, может зависеть от вашей области исследований. В руководстве Американской психологической ассоциации (APA), которое является одним из наиболее часто используемых стилей цитирования, говорится (стр. 139, 6-е издание):
источник
Такие экстремальные значения p встречаются чаще в областях с очень большими объемами данных, таких как геномика и мониторинг процессов. В этих случаях иногда сообщается как -log 10 (значение p). Посмотрите, например, этот рисунок из Nature , где значения p снижаются до 1e-26.
-log 10 (p-value) называется "LogWorth" статистиками, с которыми я работаю в JMP.
источник
в R «<2e-16» не означает буквально <2e-16, но вместо этого это означает, что значение настолько мало, что R не может записать или отобразить его.
В регрессионном тесте я часто получаю p равным 4.940656e-324, когда он выдает «<2e-16», это число даже меньше, чем 4.940656e-324
источник
<2e-16
значение является меньшим , чем2e-16
, в буквальном смысле.format.pval
или просто попробуйте, как вformat.pval(1e-16)
.