Я понимаю, что это педантично и банально, но как исследователь в области вне статистики, с ограниченным формальным образованием в области статистики, я всегда задаюсь вопросом, правильно ли я пишу «р-значение». В частности:
- Предполагается ли заглавная буква "p"?
- Предполагается, что буква «р» выделена курсивом? (Или в математическом шрифте, в TeX?)
- Должен ли быть дефис между «р» и «значением»?
- В качестве альтернативы, не существует ли вообще «правильного» способа написания «p-значения», и любой дурак поймет, что я имею в виду, если просто поместу «p» рядом со «value» в некоторой перестановке этих параметров?
hypothesis-testing
p-value
terminology
gotgenes
источник
источник
Ответы:
Похоже, не существует «стандартов». Например:
Мой краткий ненаучный опрос показывает, что наиболее распространенной комбинацией является строчный курсив p без дефиса.
источник
Похоже, это проблема стиля, когда разные журналы и издатели принимают разные соглашения (или допускают смешанную путаницу стилей в зависимости от предпочтений авторов). Мое собственное предпочтение, для чего бы это ни стоило, это p-значение, дефис без курсива и без заглавных букв.
источник
ASA House Style , кажется, рекомендует курсив в р с дефисом: р -значением. Поиск ученого Google показывает различные варианты написания .
источник
Значение P с теоретической точки зрения является некоторой реализацией случайной величины. Существует некоторый стандарт (по вероятности) использования букв верхнего регистра для случайных величин и нижнего регистра для реализаций. В заголовках таблицы мы должны использовать P (возможно, курсив ), в тексте вместе со значением p = 0,0012 и в тексте, описывающем, например, методологию p-value.
источник
Пропуск дефиса иногда может изменить смысл предложений или, по крайней мере, они могут стать двусмысленными. Это может происходить, особенно в статьях, в которых описываются статистические тесты или вводятся алгоритмы для оценки p-значений, но можно также описать методы, которые не имеют ничего общего со статистикой, и при этом вычислять p-значения из t-тестов (но не p-значений с использованием статистических т-тесты). В этом контексте дефисы действительно были бы необходимы, даже если авторы обычно стараются избегать обозначений, которые можно легко спутать.
Пример (с неправильным выбором обозначений): Мы хотели бы найти набор шаблонов сильных ассоциаций и оценить вероятность того, что результат был бы случайным. На первом этапе мы ищем z лучших моделей с некоторой оценкой добродетели. Таким образом, после фазы поиска у нас будет z баллов (но z-баллов). Затем мы оцениваем лучшие образцы с помощью рандомизированного теста. Мы генерируем t случайных наборов данных и оцениваем оценку z: th лучшего шаблона в каждом наборе данных. Итак, мы выполняем t-тесты (но не t-тесты) и выводим оценку z: th лучшего шаблона. Мы обнаруживаем, что значения p (но не значения p) всех значений t-оценки лучше, чем исходный z: th-лучший шаблон. Следовательно, мы можем оценить, что вероятность случайного получения z столь хороших паттернов равна p / t.
источник