Я собираюсь представить стандартную нормальную таблицу в своем классе вводной статистики, и это заставило меня задуматься: кто создал первую стандартную нормальную таблицу? Как они это делали до появления компьютеров? Мне страшно подумать, что кто-то перебор вычисляет тысячу римановых сумм вручную.
normal-distribution
algorithms
history
tables
Даниил Смолькин
источник
источник
Ответы:
Лаплас был первым, кто осознал необходимость табуляции, придумав следующее приближение:
Первая современная таблица нормального распределения была позже построена французским астрономом Кристианом Крампом в « Анализе астрономических и космических исследований» («Par le citoyen Kramp», «Эксперт по физкультуре и физическому искусству», 1799 г.) , Из таблиц, относящихся к нормальному распределению: краткая история Автор (ы): Герберт А. Дэвид Источник: Американский статистик, Vol. 59, № 4 (ноябрь 2005 г.), с. 309-311 :
Но ... насколько точным он мог быть? Хорошо, давайте возьмем в качестве примера:2.97
Удивительно!
Давайте перейдем к современному (нормализованному) выражению гауссовского pdf:
PDF :N(0,1)
где . И, следовательно, .z=x2√ x=z×2–√
Итак, давайте перейдем к R и посмотрим на ... ОК, не так быстро. Во-первых, мы должны помнить, что когда есть постоянная, умножающая показатель степени в показательной функции , интеграл будет разделен на этот показатель степени: . Поскольку мы стремимся воспроизвести результаты в старых таблицах, мы фактически умножаем значение на , которое должно появиться в знаменателе.PZ(Z>z=2.97) eax 1/a x 2–√
Далее, Кристиан Крамп не нормализовал, поэтому мы должны соответствующим образом исправить результаты, заданные R, умножив на . Окончательная коррекция будет выглядеть так:2π−−√
В приведенном выше случае и . Теперь давайте перейдем к R:z=2.97 x=z×2–√=4.200214
Фантастика!
Давайте пойдем на вершину таблицы для развлечения, скажем, ...0.06
Что говорит Крамп? .0.82629882
Так близко...
Дело в том ... насколько близко, точно? После всех полученных голосов я не мог оставить фактический ответ без ответа. Проблема заключалась в том, что все приложения оптического распознавания символов (OCR), которые я пробовал, были невероятно отключены - неудивительно, если вы взглянули на оригинал. Итак, я научился ценить Кристиана Крампа за упорство его работы, так как лично набирал каждую цифру в первом столбце его таблицы «Премьера» .
После некоторой ценной помощи от @Glen_b, теперь она вполне может быть точной, и она готова скопировать и вставить на консоль R в этой ссылке GitHub .
Вот анализ точности его расчетов. Готовьтесь ...
mean(abs(difference))
сdifference = R - kramp
:На записи, в которой его расчеты были наиболее расходящимися по сравнению с [R], первое разное десятичное значение было на восьмой позиции (сто миллионов). В среднем (медиана) его первой «ошибкой» была десятая десятичная цифра (десятая миллиардная!). И хотя он ни в коем случае не полностью соглашался с [R], ближайшая запись не расходится до тринадцати цифровых записей.
mean(abs(R - kramp)) / mean(R)
(такая же какall.equal(R[,2], kramp[,2], tolerance = 0)
):sqrt(mean(difference^2))
:Если вы найдете изображение или портрет Кристиана Крампа, пожалуйста, отредактируйте этот пост и разместите его здесь.
источник
Согласно HA Дэвида [1], Лаплас признал необходимость таблиц нормального распределения «еще в 1783 году», и первая нормальная таблица была произведена Крампом в 1799 году.
Лаплас предложил две серии приближений, одно для интеграла от до из (которое пропорционально нормальному распределению с дисперсией ) и одно для верхнего хвоста.0 x e−t2 12
Тем не менее, Крамп не использовал эти серии Лапласа, так как в промежутках между ними можно было с пользой применять их.
Фактически он начинает с интеграла для области хвоста от 0, а затем применяет разложение Тейлора к последнему вычисленному интегралу - то есть, вычисляя новые значения в таблице, он сдвигает своего разложения Тейлора (где - интеграл, дающий верхнюю область хвоста).x G(x+h) G
Чтобы быть конкретным, цитируя соответствующую пару предложений:
Дэвид указывает, что таблицы широко использовались.
Таким образом, вместо тысяч сумм Римана это были сотни расширений Тейлора.
На более мелкой ноте, в крайнем случае (застряв только с калькулятором и несколькими запомненными значениями из обычной таблицы), я довольно успешно применил правило Симпсона (и связанные с ним правила для численного интегрирования), чтобы получить хорошее приближение при других значениях; это не все , что утомительно для получения сокращенных таблиц * до нескольких цифр точности. [Создание таблиц масштаба и точности Крампа было бы довольно большой задачей, хотя, даже используя более умный метод, как он сделал.]
* Под сокращенной таблицей я подразумеваю одну, в которой вы можете просто избежать интерполяции между табличными значениями, не теряя слишком много точности. Если вы хотите сказать, что точность составляет около 3 цифр, вам не нужно вычислять все эти значения. Я эффективно использовал полиномиальную интерполяцию (точнее, примененную методику конечных разностей), которая учитывает таблицу с меньшим количеством значений, чем линейная интерполяция - если несколько больше усилий на этапе интерполяции, - а также выполнил интерполяцию с логит-преобразованием, которое делает линейную интерполяцию значительно более эффективной, но очень полезна, если у вас есть хороший калькулятор).
[1] Герберт А. Дэвид (2005),
«Таблицы, связанные с нормальным распределением: краткая история»,
Американский статистик , Vol. 59, № 4 (ноябрь), с. 309-311
[2] Крамп (1799), «
Анализ астрономических и космических исследований»,
Лейпциг: Швиккерт.
источник
Интересная проблема! Я думаю, что первая идея не пришла через интеграцию сложной формулы; скорее результат применения асимптотики в комбинаторике. Ручка и бумага метод может занять несколько недель; Карл Гаусс не так уж и жесток по сравнению с расчетом пирога для своих предшественников. Я думаю, что идея Гаусса была смелой; расчет был легок для него.
Пример создания стандартной таблицы z с нуля.
1. Возьмите совокупность из n (скажем, n равно 20) чисел и перечислите все возможные выборки размера r (скажем, r равно 5).
2. рассчитать образец средства. Вы получаете nCr примерное средство (здесь 20c5 = 15504 означает).
3. Их среднее значение совпадает со средним для населения. Найдите образец образца средства.
4. Найти z оценок выборочных средних, используя эти поп-средние и стандартные значения выборочных средних.
5. Сортируйте z в порядке возрастания и найдите вероятность того, что z находится в диапазоне значений nCr z.
6. Сравните значения с обычными таблицами. Меньшее n хорошо для ручных расчетов. Чем больше n, тем ближе приблизительные значения нормальных таблиц.
Следующий код находится в r:
Вероятность падения z между 0 и положительным значением q ниже; сравнить с известной таблицей. Манипулируйте q ниже от 0 до 3,5 для сравнения.
источник