Что касается p-значения s, мне интересно, почему % и % кажутся золотым стандартом для . Почему не другие значения, такие как % или %?"statistical significance"
Есть ли фундаментальная математическая причина для этого или это просто широко распространенное соглашение?
Ответы:
Если вы проверите ссылки ниже, вы найдете довольно много изменений в фоновом режиме, хотя есть некоторые общие элементы.
Эти цифры, по крайней мере, частично основаны на некоторых комментариях Фишера, где он сказал
(при обсуждении уровня 1/20)
С другой стороны, он был иногда более широким:
Фишер также использовал 5% для одной из таблиц своей книги - но большинство других его таблиц имели большее разнообразие уровней значимости
Некоторые из его комментариев предлагают более или менее строгие (то есть более низкие или более высокие альфа-уровни) подходы в различных ситуациях.
Такого рода обсуждения выше привели к тенденции создавать таблицы с акцентом на 5% и 1% уровней значимости (а иногда и с другими, такими как 10%, 2% и 0,5%) для отсутствия каких-либо других «стандартных» значений.
Тем не менее, в этой статье Коулз и Дэвис предполагают, что использование 5% - или что-то близкое к этому - восходит дальше, чем комментарий Фишера.
Короче говоря, наше использование 5% (и в меньшей степени 1%) является в значительной степени произвольным соглашением, хотя очевидно, что многие люди считают, что по многим проблемам они находятся на подходящем уровне.
Нет причин, по которым следует использовать конкретное значение.
Дальнейшие ссылки:
Dallal, Gerard E. (2012). Маленький справочник статистической практики. - Почему 0,05?
Стиглер, Стивен (декабрь 2008). «Фишер и 5% уровень». Шанс 21 (4): 12. доступно здесь
(Между ними вы получаете достаточный опыт - похоже, что между ними есть хороший повод для размышлений об уровнях значимости, по крайней мере, в общем приблизительном балле 5%, скажем, между 2% и 10% - более или менее воздух на некоторое время.)
источник
Я должен дать не ответ (так же, как здесь ):
Rosnow, RL & Rosenthal, R. (1989). Статистические процедуры и обоснование знаний в психологической науке. Американский психолог , 44 (10), 1276-1284. PDF
В документе содержится еще несколько дискуссий по этому вопросу.
источник
Я считаю, что есть некоторая базовая психология для 5%. Я должен сказать, что я не помню, где я поднял это, но вот упражнение, которое я делал для каждого старшекурсника.
Затем я поднимаю руку: кто будет убежден, что монета смещена, если раскол 5/5? 4/6? 3/7? 2/8? 1/9? 0/10? Ну, первые два или три никого не убедят, а последний убедит всех; 2/8 и 1/9 убедили бы большинство людей, все же. Теперь, если вы посмотрите биномиальную таблицу, 2/8 - 5,5%, а 1/9 - 1%. QED.
Если кто-то сейчас читает вступительный курс, я бы посоветовал вам тоже выполнить это упражнение и опубликовать свои результаты в виде комментариев, чтобы мы могли накопить большой массив результатов метаанализа и опубликовать их по крайней мере на американском языке. Учебный уголок статистиков . Не стесняйтесь менять и односторонние и двухсторонние условия!n
В другом ответе Glen_b цитирует Фишера, в котором обсуждается, следует ли изменять эти магические числа в зависимости от того, насколько серьезна проблема, поэтому, пожалуйста, не делайте этого. «Существует новое лечение лейкемии вашей сестры, но это либо вылечит ее 3 месяца или убейте ее за 3 дня, так что давайте подбросим несколько монет »- это выглядело бы так же глупо, как печально известный комикс xkcd, который даже Эндрю Гельману не очень понравился.
Говоря о монетах и Гельмане, у TAS была очень любопытная статья Гельмана и Нолана под названием «Вы можете загрузить кубик, но вы не можете сместить монетку» , выдвигая аргумент, что монета подбрасывалась в воздух или вращалась на настольная, потратит примерно половину времени на хедз-апы, а другое время - на хвосты, поэтому сложно придумать физический механизм для серьезного смещения монеты. (Очевидно, это было исследование паба, поскольку они экспериментировали с крышками от бутылок пива.) С другой стороны, загрузка штампа - это относительно простая вещь, и я дал своим студентам упражнение с примерно 1 см / половиной. -дюймовые деревянные кубики из местного магазина хобби и наждачная бумага с просьбой загрузить матрицу и доказать мне, что она загружена - что было упражнением в тесте Пирсона на пропорции и его мощность.χ2
источник
5%, по-видимому, были округлены с 4,56% по Фишеру, что соответствует «хвостовым участкам кривой за пределами среднего плюс три или минус три вероятные ошибки» (Hurlbert & Lombardi, 2009).
Другим элементом этой истории является воспроизведение таблиц с критическими значениями (Pearson et al., 1990; Lehmann, 1993). Фишер не получил разрешения от Пирсона на использование его таблиц (вероятно, из-за маркетинга Пирсоном его собственной публикации (Hurlbert & Lombardi, 2009) и проблемного характера их отношений.
Hurlbert, SH & Lombardi, CM (2009, октябрь). Окончательный крах теоретической основы решения Неймана-Пирсона и рост неофишерианства. В Annales Zoologici Fennici (том 46, № 5, с. 311-349). Финское Зоологическое и Ботаническое Издательство
Lehmann, EL (1993). Теории проверки гипотез Фишера-Неймана-Пирсона: одна теория или две? Журнал Американской статистической ассоциации, 88 (424), 1242-1249.
Пирсон Е.С., Госсет В.С., Плакетт Р.Л. и Барнард Г.А. (1990). Студент: статистическая биография Уильяма Сили Госсета. Издательство Оксфордского университета, США.
См. Также: Gigerenzer, G. (2004). Бессмысленная статистика. Журнал социально-экономических, 33 (5), 587-606.
Хаббард Р. и Линдсей Р.М. (2008). Почему значения P не являются полезной мерой доказательства в тестировании статистической значимости. Теория и психология, 18 (1), 69-88.
источник
Мне кажется, что ответ скорее в теории игр, чем в статистике. Сжигание 1% и 5% в общем сознании означает, что исследователи не могут эффективно выбирать уровни значимости, которые соответствуют их предрасположенности. Скажем, мы увидели бумагу с p-значением 0,055, где уровень значимости был установлен на уровне 6% - будут заданы вопросы. 1% и 5% обеспечивают форму заслуживающего доверия обязательства.
источник
Моя личная гипотеза состоит в том, что 0,05 (или 1 из 20) связано со значением at / z (очень близким к) 2. Использование 2 - это хорошо, потому что очень легко определить, является ли ваш результат статистически значимым. Других слияний круглых чисел нет.
источник
Единственный правильный номер .04284731
... который является легкомысленным ответом, предназначенным для обозначения того, что выбор .05 по сути произвольный. Я обычно просто сообщаю значение p, а не то, что значение p больше или меньше.
«Значение» - это непрерывная переменная, и, на мой взгляд, ее дискретизация часто приносит больше вреда, чем пользы. Я имею в виду, что если р = 0,13, у вас больше уверенности, чем если р = 0,21 и меньше, чем если р = 0,003
источник
Это область проверки гипотез, которая всегда очаровывала меня. Именно потому, что однажды кто-то определился с произвольным числом, которое дихотомизировало процедуру тестирования, и с тех пор люди редко подвергают ее сомнению.
Я помню, как лектор говорил нам не слишком доверять тесту инструментальных переменных Стейгера и Стокса (где F-stat должен быть выше 10 на первой стадии регрессии, чтобы избежать проблем со слабым инструментом), потому что число 10 было совершенно произвольный выбор. Я помню, как говорил: «Но разве это не то, что мы делаем с помощью регулярного тестирования гипотез?»
источник
Почему 1 и 5? Потому что они чувствуют себя хорошо.
Я уверен, что есть исследования эмоциональной ценности и когнитивной значимости конкретных чисел, но мы можем понять выбор 1 и 5, не прибегая к исследованиям.
Люди, которые создали сегодняшнюю статистику, родились, выросли и живут в десятичном мире. Конечно, существуют недесятичные системы подсчета, и подсчет до двенадцати с использованием фаланг возможен и был выполнен, но это не очевидно так же, как использование пальцев (которые поэтому называются «цифрами», как числа ). И хотя вы (и Фишер), возможно, знаете о недесятичных системах подсчета, десятичная система является и была преобладающей системой подсчета вашей (и мира Фишера) в последние сто лет.
Но почему цифры пять и один особенные? Потому что оба являются наиболее естественными подразделениями основной десятки: один палец, одна рука (или: половина).
Вам даже не нужно заходить так далеко, чтобы осмыслить дроби, чтобы получить от десяти до одного и пяти. Тот просто там, так же, как твой палец просто там. И наполовину что-то - операция, намного более простая, чем деление этого на любую другую пропорцию. Разрезание чего-либо на две части не требует размышлений, а деление на три или четыре уже довольно сложно.
Большинство валютных систем валют имеют монеты и банкноты со значениями, такими как 1, 2, 5, 10, 20, 50, 100, 200, 500, 1000. Некоторые валютные системы не имеют 2, 20 и 200, но почти все имеют те, которые начинаются в 1 и 5. В то же время большинство валютных систем не имеют монеты или банкноты, которые начинаются с 3, 4, 6, 7, 8 или 9. Интересно, не правда ли? Но почему это так?
Потому что вам всегда нужны десять из 1 или два из 5 (или пять из 2), чтобы прийти к следующему большему заказу. Расчет с деньгами очень прост: раз десять или вдвое. Всего два вида операций. Каждая имеющаяся у вас монета составляет половину или десятую часть монеты следующего порядка. Эти числа умножаются и складываются легко и хорошо.
Таким образом, 1 и 5 были глубоко укоренились с самого раннего детства в Фишера, и тот, кто выбрал уровни значимости в качестве самых простых, самых простых, самых основных делений на 10. Любое другое число нуждается в аргументе для этого, в то время как цифры просто есть.
В отсутствие объективного способа расчета соответствующего уровня значимости для каждого отдельного набора данных, один и пять просто чувствуют себя хорошо.
источник