При обучении статистике использовать «нормальный» или «гауссовский»?

42

В своей книге я использую в основном «гауссовское распределение», но кто-то просто предложил мне перейти к «нормальному распределению». Какой консенсус по какому термину использовать для начинающих?

Конечно, эти два термина являются синонимами , поэтому речь идет не о веществе, а о том, какой термин употребляется чаще. И конечно я использую оба термина. Но что следует использовать в основном?

Харви Мотульский
источник
1
Есть ли где-нибудь раздел предварительного просмотра / образец вашей книги? Я слышал хорошие вещи об этом.
Glen_b
2
@Glen_b Функция «взгляд изнутри» на amazon.com позволяет вам предварительно просмотреть книгу. Кроме того, три главы доступны здесь: intuitivebiostatistics.com/excerpts
Харви Мотульский,
6
Вопрос о «термин , который является более широко используется» легко может быть решена, хотя и грубо: поискаШлюпка Google распределения «гауссова» имеет около 2/3 хитов поиска для «нормального распределения» . Это соотношение немного отличается в Google Scholar, где теперь «гауссово распределение» имеет половину совпадений с «нормальным распределением» (но только четверть, когда «обратное» исключено). Эти результаты показывают, что (1) «нормальный» более популярен, но (2) «гауссовский» широко известен. Глядя на результаты, можно предположить, что такие фразы, как «асимптотически нормальные», могут занять много времени для замены, если вообще когда-либо.
whuber
2
В расширении @whuber, я думаю, есть также разница между полями: «гауссовский» кажется относительно более преобладающим в науке, тогда как «нормальный», кажется, является нормальным термином в социальных науках ...
abaumann
1
Попробуйте «ненормально»: P
Mehrdad

Ответы:

47

Несмотря на то, что я склонен чаще говорить «нормально» (так как меня учили при первом обучении), я думаю, что «гауссовский» - лучший выбор, если студенты / читатели хорошо знакомы с обоими терминами:

  • Нормальное не особенно типично, поэтому само название вводит в заблуждение. Это, безусловно, играет важную роль (не в последнюю очередь из-за CLT), но наблюдаемые данные гораздо реже, особенно вблизи гауссовских, чем иногда предлагают.

  • Слово (и связанные слова, такие как «нормализовать») имеет несколько значений, которые могут иметь отношение к статистике (например, рассмотрим «ортонормированную основу»). Если кто-то говорит: «Я нормализовал свою выборку», я не могу точно сказать, преобразовались ли они в нормальность, вычислили ли они z-значения, масштабировали вектор до длины единицы, до длины или ряда других возможностей. Если мы склонны называть распределение «гауссовским», то по крайней мере первый вариант исключается, а что-то более наглядное заменяет его.N

  • Гаусс, по крайней мере, имеет разумную степень притязаний на распределение.

Glen_b
источник
3
+1 за бит «пока студенты / читатели хорошо знакомы с обоими терминами». Я думаю, что студентам было бы вредно преподавать только «гауссовский» только потому, что «нормальный» настолько распространен.
Патрик Куломб
6
Я согласен, что мы должны учить обоих. Если бы мы начинали с нуля и знали то, что знаем сейчас, мы бы никогда не допустили появления «нормального», потому что (1) термин перегружен каким-либо образом (2) нормальный (гауссовский) не является нормальным (обычный или ожидаемый) данных. «Гауссиан» является наиболее распространенной альтернативой, хотя история до Гаусса существует. ET Джейнс предложил «центральный», что является нелепой идеей, но она не завоевала популярность. (Я признаю аргументы, которые основаны на центральной предельной теореме.)
Ник Кокс
Что касается пункта № 2, то, когда речь идет о более широкой науке и математике в целом, не всегда ясно, является ли « нормальный » или « гауссовский » более распространенным. ;-)
кардинал
@cardinal - Я полностью согласен с предположением, что в этих областях он имеет тенденцию к большей склонности к «гауссовскому» - и я бы добавил также инженерию.
Glen_b
1
@Glen_b: Согласен. (В моей ментальной модели я включаю инженерию под общим научным уклоном, хотя это, возможно, несколько выходит за рамки, хм, нормы.) :-)
кардинал
36

Я бы использовал Gaussian.

Одна проблема, с которой сталкиваются люди, изучающие статистику, заключается в том, что мы используем повседневные английские слова для обозначения разных вещей (мощность, значимость, распределение и т. Д.). В той степени, в которой мы можем минимизировать это, мы должны. «Нормальный» уже имеет множество значений.

Питер Флом - Восстановить Монику
источник
2
Питер: я согласен. Вот почему я всегда использовал «гауссовский». Но комментарий рецензента о новом (лаконичном) издании сильно толкнул «нормально».
Харви Мотульский
25

Одним из аргументов в пользу нормали является укоренившееся обозначение для распределения, в котором N обозначает «нормаль». Я не видел, чтобы кто-нибудь предложил изменить это на G ( μ , σ 2 ) .N(μ,σ2)Nг(μ,σ2)

Нейт Элдридж
источник
1
гΓгaUssгaUssяaNВерNоULLябяNомяaLбяNомN
N
8
г~N(μ,σ2)
1
N(μ,σ2)
10

На немецком языке его часто называют Gaußsche Normalverteilung, поэтому почти невозможно легко вступить в конфликт.

Было бы уместно сочетать гауссовский и нормальный ?

gismo141
источник
8
Возможно, gnormalбудет работать на английском языке!
Дилип Сарвате
2
@DilipSarwate 𝅘𝅥𝅮 Я ненормальный, еще один ненормальный 𝅘𝅥𝅮 (извиняюсь перед господами. Фландрия и Суонн)
Хоббс
9

Согласно энциклопедии Вольфрама :

В то время как статистики и математики равномерно используют термин «нормальное распределение» для этого распределения, физики иногда называют его распределением Гаусса, и из-за его изогнутой формы вспышек социологи называют его «кривой колокола».

Я согласен, что «нормальный» легче спутать - но я подозреваю, что в статистических книгах обычно используется «нормальный».

Gerenuk
источник
+1 за ответ, скорее описательный, чем предписывающий. Я на самом деле согласен с другими ответами, что гауссиан предпочтительнее, независимо от того, в какой области, но это информативно, чтобы начать с контекста того, что широко используется в существующем использовании.
R ..
Что касается фразы «кривая колокола», я бы ее полностью избегал в любой учебной обстановке. Это имеет очень расистские оттенки в результате печально известной книги с тем же названием, и любой из ваших учеников, которые знают об этом, вероятно, будет отвлекаться на нее и ассоциировать все, что вы говорите, с бессмысленными теориями о расовом превосходстве, а не иметь субъект стоит сам по себе.
R ..
@R .. Описательно, да, но это описание прямо противоречит ответам здесь, которые указывают, что значительная часть статистиков и математиков фактически использует термин «гауссовский».
Дэвид Ричерби
Другая причина того, что термин «кривая колокола» не используется для обозначения гауссовского / нормального распределения (функции плотности), состоит в том, что существует много распределений , функция плотности вероятности которых (pdf) напоминает кривую колокола. Даже PDF распределения Коши выглядит как кривая колокола!
Mico
+1 за объяснение относительных терминов в разных дисциплинах. Благодарность!
Энтузиаст
7

Я хотел бы отметить, что С. Стиглер использует нормальное распределение / распределение Гаусса / Лапласа-Гаусса, чтобы доказать «закон эпонимии Стиглера», опубликованный в разделе « Статистика по таблице» (некоторые страницы доступны на books.google ).

Особенно интересным и актуальным для этих вопросов является то, что на стр. 287-288 есть таблицы исторического использования «Нормальный» против «Гаусс» против «Лаплас», и кажется, что за эти годы использование изменилось с 2:15 в пользу обычно с 1816-1884 по 8:14 (1888-1917) до 5:17 (1919-1939) до 9:10 (1947-1976).

Таким образом, в соответствии с этим использование «нормальный» против «гаусс» становится более равным. Или, если вы верите, что эта тенденция сохранится, то «Гаусс» превзойдет «нормальное» через 50–100 лет.

стопа
источник
5

Ответ, который я еще не видел среди всех хороших ответов:

Я в основном использую «нормальный» по причинам предыдущего знакомства, но мне нравится использовать его для своей выгоды, чтобы подчеркнуть его техническое значение: «... если данные обычно распределяются ...» (я не знаю, скопировал ли я эту практику из где-то еще или (заново) изобрел это сам)

Бен Болкер
источник
5

Какой из них использовать, зависит от уровня обучаемой статистики. К сожалению, мой опыт преподавания показывает, что большинство студентов не полностью понимают концепцию распределения вероятностей. Тем не менее, они все должны каким-то образом вступить в борьбу с CLT и способами думать о неопределенности. Для студенческого класса, Нормальный предпочтительнее, потому что он не добавляет беспокойство нового незнакомого слова. Для аспирантов предпочтительным является гауссовский язык из-за всего вышеупомянутого беспорядка по нормализации и историческому контексту, который это обеспечивает. Я преподаю учебный курс для студентов, требующий двух обязательных классов статистики, и все книги для студентов, которые я видел за последние 30 лет, использовали Нормальный.

Ти Джей Олни
источник
1
«Большинство студентов бакалавриата никогда полностью не понимают концепцию распределения вероятностей» +1
Code-Guru
4

Название normalпришло из некоторых наблюдений, согласно которым ошибки ведут себя нормально. Вы найдете более подробную информацию здесь . Если это является причиной для того, чтобы назвать это распределение нормальным распределением, это может создать новую путаницу, как нормальное распределение для количества несчастных случаев poisson. Я считаю, что мы должны двигаться вперед и начать называть это Gaussianвместо.

Махбубул Мажумдер
источник