Я пытаюсь написать серию постов в блоге о p-значениях, и я подумал, что было бы интересно вернуться к тому, с чего все началось, - похоже, это статья Пирсона 1900 года. Если вы знакомы с этим документом, вы помните, что он охватывает тестирование на пригодность.
Пирсон немного болтает со своим языком, когда речь идет о p-значениях. Он неоднократно использует «шансы» при описании того, как интерпретировать его значение p. Например, на стр.168, говоря о результатах повторных бросков по 12 кубиков, он говорит: « ... что приводит нас к P = .0000016, или шансы равны 62,499 к 1 против такой системы отклонения на случайной основе отбор. С такими шансами было бы разумно сделать вывод, что игральные кости демонстрируют уклон к более высоким точкам ».
В этой статье он ссылается на более раннюю работу, включая книгу Мерримана о наименьших квадратах 1891 года.
Но Пирсон действительно выкладывает исчисление для p-значений (с точки зрения критерия соответствия по критерию хи-квадрат).
Был ли Пирсон первым человеком, который задумал p-значения? Когда я делаю поиск по p-значениям, упоминается Фишер - и его работа была в 1920-х годах.
Отредактировано: и спасибо за упоминание Лапласа - он, кажется, не рассматривал нулевую гипотезу (кажется, что Пирсон делает это неявно, хотя он никогда не использовал этот термин в своей статье 1900 года). Пирсон рассмотрел правильность проверки соответствия: если предположить, что подсчеты получены из непредвзятого процесса, какова вероятность того, что наблюдаемые подсчеты (и подсчета более отклоняются) возникают из предполагаемого распределения?
Его трактовка вероятностей / шансов (он преобразует вероятности в шансы) предполагает, что он работает с неявной идеей нулевой гипотезы. Важно отметить, что он также упоминает, что вероятность, возникающая из значения x ^ 2, показывает шансы «против системы отклонений как невероятные или более невероятные, чем этот» - язык, который мы сейчас узнаем, - в отношении его вычисленных значений p.
Арбутнот зашел так далеко?
Не стесняйтесь размещать ваши комментарии в качестве ответов. Было бы неплохо увидеть обсуждение.
источник
Ответы:
Джейкоб Бернулли (~ 1700) - Джон Арбутнот (1710) - Николай Бернулли (1710-е) - Авраам де Моивр (1718)
Случай с Arbuthnot 1, см. Объяснение в примечании ниже , также может быть прочитан в « Доктрине случайности» (1718) де Мойвра со страницы 251-254, которая расширяет эту линию мышления.
De Moivre делает два шага / продвижения:
Нормальное приближение распределения Бернулли, которое помогает легко вычислить вероятности для результатов, находящихся в пределах или вне определенного диапазона. В разделе перед примером о случае Арбутно де Моивр пишет о своем приближении (теперь называемом гауссовым / нормальным распределением) для распределения Бернулли. Это приближение позволяет легко вычислить p-значение (что Арбутнот не мог сделать).
Обобщение аргумента Арбутнота. Он упоминает, что «этот метод рассуждения также может быть полезен в некоторых других очень интересных запросах». (что может дать частичную заслугу де Моивру за то, что он увидел общую применимость аргумента)
По словам де Мойвра, Джейкоб Бернулли писал об этой проблеме в своем « Арсе Конъектанди» . Де Моивр называет это по-английски: «Назначение границ, в пределах которых при повторении экспериментов вероятность события может приближаться бесконечно к заданной вероятности», но оригинальный текст Бернуилли на латыни. Я не знаю достаточно латыни, чтобы понять, писал ли Бернулли о понятии, подобном p-значению, или, скорее, о законе больших чисел. Интересно отметить, что Бернуилли утверждает, что имел эти идеи в течение 20 лет (а также работа 1713 была опубликована после его смерти 1705 года, так что, похоже, она предшествует дате 1710 года, упомянутой в комментариях @Glen_b для Arbuthnot).
Одним из источников вдохновения для де Мойвра был Николаус Бернуилли, который в 1712/1713 годах произвел расчеты для вероятности того, что число рожденных мальчиков будет не менее 7037 и не более 7363, когда 14000 - это общее число рожденных детей и вероятность для мальчика 18/35.
(Числа для этой проблемы были основаны на 80-летней статистике по Лондону. Он писал об этом в письмах Пьеру Раймонду де Монтморту, опубликованных во втором издании (1713 г.) «Монтмортского эссе« Анализ опасности » .)
Расчеты, которые я не совсем выполнил, с вероятностью 43,58 к 1. (Используя компьютер, суммирующий вероятность всех членов бинома от 7037 до 7363, я получаю 175: 1, поэтому, возможно, я неверно истолковал его работу / расчет. )
1: Джон Арбутнот писал об этом случае в «Аргументе о божественном провидении», взятом из постоянной закономерности, наблюдаемой при рождении обоих полов (1710).
Автор StackExchangeStrike
источник
У меня есть три поддерживающие ссылки / аргументы, которые поддерживают дату ~ 1600-1650 для формально разработанной статистики и намного раньше просто для использования вероятностей.
Если вы принимаете гипотезу в качестве основы, предшествующей вероятности, то онлайн-словарь этимологии предлагает следующее:
Викисловарь предлагает:
По вероятности и статистике Википедия предлагает:
Из "Wolfram, Stephen (2002). Новый вид науки. Wolfram Media, Inc., стр. 1082.":
Другие источники:
Раздел «Историческое происхождение» гласит:
[1]. Арбутнотт Дж. Аргументация в пользу божественного провидения, взятая из постоянной регулярности, наблюдаемой при рождении обоих полов. Фил Транс 1710; 27: 186–90. doi: 10.1098 / rstl.1710.0011, опубликовано 1 января 1710 г.
У нас есть дальнейшее обсуждение на нашем сайте SE относительно метода Фишера против Неймана-Пирсона-Уолда здесь: действительно ли «гибрид» между подходами Фишера и Неймана-Пирсона к статистическому тестированию действительно является «бессвязной путаницей»? ,
Статья в Журнале Эпидемиологии и Биостатистики (2001) Vol. 6, № 2, 193–204 от Сенна, под названием: «Мнение: два приветствия для P-значений?» объясняет это во введении:
Ссылки
Американская статистическая ассоциация имеет веб-страницу по истории статистики, на которой, наряду с этой информацией, имеется плакат (частично воспроизведенный ниже) под названием «Хронология статистики».
Н.э. 2: Доказательства переписи, завершенной во время династии Хань, сохранились.
1500-е годы: Джироламо Кардано рассчитывает вероятности различных бросков костей.
1600-е годы: Эдмунд Халли связывает уровень смертности с возрастом и разрабатывает таблицы смертности.
1700-е годы: Томас Джефферсон руководит первой переписью в США.
1839: образована Американская статистическая ассоциация.
1894: термин «стандартное отклонение» введен Карлом Пирсоном.
1935: Р.А. Фишер публикует «Дизайн экспериментов».
В разделе «История» веб-страницы Википедии « Закон больших чисел » это объясняет:
Нет, наверное нет.
В « Заявлении ASA о p-значениях: контекст, процесс и цель » (09 июня 2016 г.) Wasserstein and Lazar, doi: 10.1080 / 00031305.2016.1154108, есть официальное заявление об определении p-значения (которое не является сомнение не согласовано всеми дисциплинами, использующими или отвергающими p-значения), которое гласит:
" . Что такое p-значение?
Неформально, p-значение - это вероятность согласно определенной статистической модели, что статистическая сводка данных (например, среднее значение выборки между двумя сравниваемыми группами) будет равной или более экстремальной, чем ее наблюдаемое значение.
3. Принципы
...
6. Само по себе значение р не является хорошим показателем в отношении модели или гипотезы.
Исследователи должны признать, что значение p без контекста или других доказательств предоставляет ограниченную информацию. Например, p-значение около 0,05, взятое само по себе, предлагает лишь слабые доказательства против нулевой гипотезы. Аналогичным образом, относительно большое значение р не подразумевает доказательств в пользу нулевой гипотезы; многие другие гипотезы могут быть в равной степени или более соответствовать наблюдаемым данным. По этим причинам анализ данных не должен заканчиваться вычислением p-значения, когда другие подходы являются подходящими и осуществимыми ».
Отказ от нулевой гипотезы, вероятно, произошел задолго до Пирсона.
Страница Википедии о ранних примерах тестирования нулевой гипотезы :
Ранний выбор нулевой гипотезы
Пол Миль утверждал, что эпистемологическая важность выбора нулевой гипотезы осталась в значительной степени непризнанной. Когда нулевая гипотеза предсказывается теорией, более точный эксперимент будет более серьезным испытанием основной теории. Когда нулевой гипотезой по умолчанию является «без разницы» или «без эффекта», более точный эксперимент является менее серьезным испытанием теории, которая мотивировала проведение эксперимента. Поэтому изучение истоков последней практики может быть полезным:
1778: Пьер Лаплас сравнивает рождаемость мальчиков и девочек в нескольких европейских городах. Он заявляет: «Естественно сделать вывод, что эти возможности почти одинаковы». Таким образом, нулевая гипотеза Лапласа о том, что рождаемость мальчиков и девочек должна быть одинаковой, учитывая «общепринятую мудрость».
1900: Карл Пирсон разрабатывает критерий хи-квадрат, чтобы определить, «будет ли данная форма частотной кривой эффективно описывать образцы, взятые из данной популяции». Таким образом, нулевая гипотеза состоит в том, что популяция описывается некоторым распределением, предсказанным теорией. В качестве примера он использует числа пять и шесть в данных броска костей Уэлдона.
1904: Карл Пирсон разрабатывает концепцию «непредвиденных обстоятельств», чтобы определить, являются ли результаты независимыми от данного категориального фактора. Здесь нулевая гипотеза по умолчанию состоит в том, что две вещи не связаны (например, образование рубцов и смертность от оспы). Нулевая гипотеза в этом случае больше не предсказывается теорией или общепринятым мнением, но вместо этого является принципом безразличия, которое приводит Фишера и других к отказу от использования «обратных вероятностей».
Несмотря на то, что одному человеку приписывают отказ от нулевой гипотезы, я не думаю, что было бы разумно называть его « обнаружением скептицизма, основанного на слабом математическом положении».
источник