Статистика не математика?

20

Статистика математика или нет?

Учитывая, что это все цифры, которые в основном преподаются математическими отделами, и вы получаете за это математические баллы, мне интересно, говорят ли они просто в шутку, когда говорят это, например, говорят, что это незначительная часть математики, или просто прикладная математика.

Интересно, можно ли считать математику чем-то вроде статистики, где вы не можете построить все на основных аксиомах? Например, значение, которое возникло для понимания данных, но не является логическим следствием более базовых принципов.п

Quora Feans
источник
10
Обязательная ссылка XKCD : xkcd.com/435 . Во всяком случае, это действительно имеет значение?
Нико
2
(i) Как бы мы оценили такие вещи? Это не так, как будто это было предметом опроса! (ii) В вычислениях почти всегда участвуют числа, но то, что делает их статистическими , на мой взгляд, обычно не в расчетах . (iii) Когда я поступил в бакалавриат по специальности статистика, его не было на математическом факультете. Место, где я защитил докторскую диссертацию - под руководством двух довольно известных статистиков, - тоже не было математическим факультетом. (iv) Я не думаю, что это шутка. Это относится к очень важной идее - то, что делает статистику «статистикой», это скорее способ рассуждения о конкретных типах проблем.
Glen_b
6
Я чувствую себя обязанным дать краткий ответ, так как я бывший чистый математик (доктор философии и 3,5 года постдока в какой-то алгебре), а теперь - прикладной статистик ... ну, какую статистику вы изучаете для прикладной статистики, например " когда я использую тест "или что нет, для математика выглядит как книга рецептов, а не как математика. Но, например, «Асимптотическая статистика Ван дер Ваарта» - это определенно математическая книга ... Есть много промежуточных уровней - некоторые из них не очень хорошо заполнены, я думаю, что не хватает книг, объясняющих статистику с множеством реальных примеров и всеми математическими Детали. T
Элвис
5
Я не знаю, что делать с утверждением « значение, которое является концепцией, возникшей для осмысления данных, но не является логическим следствием более базовых принципов», я даже не уверен, если это может даже быть правильным или неправильным. Похоже, что это в основном происходит из запутанных помещений. п
gung - Восстановить Монику
12
@Guy По аналогии мы можем охарактеризовать химию (еще одну «математическую дисциплину») как асимптотическую теорию распределения и алгебры C *. Делать это номинально точно, но совершенно не учитывать суть химии и ее цели, так что ни один химик ее не узнает. Точно так же сопоставьте ваши характеристики с тем, что ведущие профессиональные общества говорят о статистике : они - разные миры. «Наука обучения на основе данных, а также измерения, контроля и передачи информации о неопределенности». Ни одного упоминания о вероятности нет.
whuber

Ответы:

15

Математика имеет дело с идеализированными абстракциями, которые (почти всегда) имеют абсолютные решения, или тот факт, что такого решения не существует, как правило, может быть полностью описан. Это наука об обнаружении сложных, но необходимых следствий из простых аксиом.

Статистика использует математику, но это не математика. Это образованное предположение. Это азартная игра

Статистика не имеет дело с идеализированными абстракциями (хотя она использует некоторые в качестве инструментов), она имеет дело с явлениями реального мира. Статистические инструменты часто делают упрощающие предположения, чтобы свести грязные данные реального мира к чему-то, что вписывается в проблемную область решаемой математической абстракции. Это позволяет нам делать обоснованные догадки, но на самом деле это все, что есть в статистике: искусство делать очень хорошо обоснованные догадки.

Рассмотрим проверку гипотез с p-значениями. Допустим, мы проверяем некоторую гипотезу со значением , и после сбора данных мы находим p-значение 0,001 . Поэтому мы отвергаем нулевую гипотезу в пользу альтернативной гипотезы.αзнак равно0,010,001

Но что это за величина p? Какое значение? Наша тестовая статистика была разработана таким образом, чтобы она соответствовала определенному распределению, вероятно, т студента. Согласно нулевой гипотезе, процентиль нашей наблюдаемой статистики теста является p-значением. Другими словами, p-значение дает вероятность того, что мы получим значение так же далеко от ожидания распределения (или дальше), как наблюдаемая статистика теста. Уровень значимости - это довольно произвольное ограничение по эмпирическому правилу: установка его на эквивалентна высказыванию «приемлемо, если 1 из 100 повторений этого эксперимента предполагает, что мы отвергаем нуль, даже если ноль на самом деле является истинным». "0,01

Значение p дает нам вероятность того, что мы наблюдаем данные под рукой, учитывая, что нулевое значение является истинным (или, точнее, получая немного более техническую информацию), что мы наблюдаем данные при нулевой гипотезе, которая дает нам, по крайней мере, как экстремальное значение проверил статистику как то что мы нашли). Если мы собираемся отклонить нуль, то мы хотим, чтобы эта вероятность была мала, чтобы приблизиться к нулю. В нашем конкретном примере мы обнаружили, что вероятность наблюдения данных, которые мы собрали, если нулевая гипотеза верна, составляла всего , поэтому мы отклонили нулевое значение. Это было обоснованное предположение. Мы никогда не знаем наверняка, что нулевая гипотеза неверна, используя эти методы, мы просто разрабатываем измерение того, насколько сильно наши доказательства подтверждают альтернативу.0,1%

Мы использовали математику для вычисления p-значения? Конечно. Но математика не дала нам нашего заключения. Основываясь на доказательствах, мы сформировали образованное мнение, но это все еще игра. Мы обнаружили, что эти инструменты чрезвычайно эффективны в течение последних 100 лет, но люди будущего могут в ужасе удивляться хрупкости наших методов.

Дэвид Маркс
источник
6
Значение p не является вероятностью того, что мы ошибаемся, когда отвергаем нулевую гипотезу, поскольку это также зависит от H1, который не входит в вычисление значения p (хорошо показано на i.stack.imgur.com/tStr4 .png - вероятность того, что H0 ошибочна и что солнце взорвалось, значительно меньше, чем p = 1/36).
Дикран Сумчатый
Не могли бы вы предложить более простую языковую интерпретацию значения p? «Вероятность того, что мы наблюдаем данные под рукой при нулевом значении, является правдой», возможно? Я уже углубился в пример с p-значением, чем собирался. Моим намерением было сделать упор на статистику, а не предоставить учебник по интерпретации р-значений. Я не хочу быть слишком сорванным. Спасибо за указание на это, в любом случае.
Дэвид Маркс
2
Значение p - это вероятность результата, по крайней мере, такого же экстремального, как и тот, который наблюдается, если нулевая гипотеза верна. Точка зрения о том, что связь между правдоподобностью нулевой гипотезы и значением p в значительной степени субъективна, а не логической необходимостью, является хорошей точкой (+1). В последнее время меня интересует, является ли тестирование гипотезы на частоте менее субъективным, чем байесовский подход, где, по крайней мере, субъективность делается более явной.
Дикран Сумчатый
Мне не ясно, как ваша интерпретация / определение p-значения отличается от альтернативы, которую я предложил в моем последнем комментарии. Конечно, в тестировании частых гипотез существует определенная степень субъективности, но это та же разновидность субъективности, которая вызывается при интерпретации байесовского фактора. И это не означает, что уровень значимости не сообщается (то есть субъективность здесь также указана явно), он просто часто выбирается на основе соглашения, в то время как при выборе (информативных) байесовских априоров обычно уделяется больше внимания.
Дэвид Маркс
1
@ Дэвид: «по крайней мере, как крайний» имеет большое значение - вероятность наблюдаемого значения при нулевом значении вообще не является p-значением, даже для статистики дискретных тестов, где это имеет смысл. Я знаю, что это имеет прямое отношение к тому, что вы высказали, но если Википедия может сделать это правильно, мы должны быть в состоянии Cross Validated.
Scortchi - Восстановить Монику
10

Язык крепко в щеку:

Эйнштейн, видимо, написал

Насколько законы математики относятся к реальности, они не являются определенными; и, насколько они уверены, они не относятся к реальности.

так что статистика - это раздел математики, описывающий реальность. ; О)

Я бы сказал, что статистика - это раздел математики, так же как логика - это раздел математики. Это, конечно, включает в себя элемент философии, но я не думаю, что это единственная отрасль математики, где это имеет место (см., Например, Моррис Клайн, «Математика - потеря уверенности», Oxford University Press, 1980).

Дикран Сумчатый
источник
2
Является ли логика разделом математики? Включая трехзначные логики и модальные логики или только исчисление предикатов первого порядка? Являются ли все формальные науки как-то математикой?
Scortchi - Восстановить Монику
Я бы рассматривал изучение любой системы для манипулирования символами в соответствии с набором правил (например, формальными языками) как разновидность математики, так что да, я полагаю, что я, вероятно, хотел бы. Проблема с метками заключается в том, что они не всегда полностью описывают все, к чему они применяются (я бы не сказал, что я был точно математиком, статистиком или специалистом по компьютерам, но у меня есть некоторые аспекты всех трех). Точно так же одно и то же часто можно поместить в более чем одну иерархию, поэтому, возможно, нет единственного решения вопроса!
Дикран Сумчатый
По вашему аргументу статистика, как описание реальности, включает в себя геометрию и квантовую теорию поля, но она не включает проверку гипотез (поскольку большинство гипотез противоречивы - они предназначены для фальсификации - и, следовательно, явно не «опиши реальность»).
whuber
Цитата Эйнштейна была языком в щеку и не должна была восприниматься всерьез; Я уверен, что это не совсем то, что на самом деле имел в виду Эйнштейн!
Дикран Сумчатый
5

Хорошо, если вы говорите, что « что-то вроде статистики, где вы не можете построить все на основных аксиомах », то вам, вероятно, следует прочитать об аксиоматической теории вероятностей Колмогорова. Колмогоров определяет вероятность в абстрактной и аксиоматической форме, как вы можете видеть в этом файле PDF на странице 42 или здесь внизу страницы 1 и последующих страниц .

Просто чтобы дать вам представление о своих абстрактных определениях, он определяет случайную переменную как «измеримую» функцию, как это объясняется более «интуитивно»: если случайная переменная является функцией, то как мы можем определить функцию случайная переменная

Имея очень ограниченное количество аксиом и используя результаты (опять-таки математики) теории меры, он может определять понятия случайные величины, распределения, условную вероятность, ... абстрактным образом и выводить все хорошо известные результаты, такие как закон больших чисел, ... из этого набора аксиом. Я советую вам попробовать, и вы будете удивлены его математической красотой.

Для объяснения p-значений я обращаюсь к: Непонимание P-значения?

user83346
источник
1
Разве все же нет важного различия между теорией вероятности (математика) и ее применением к задачам логического вывода (статистика)? Байесовский и частичный подходы показывают один и тот же математический аппарат ( обычно или почти ), используемый с совершенно разными понятиями вероятности.
Scortchi - Восстановить Монику
@ Scortchi: я не уверен, отличаются ли понятия вероятности для частых и байесовских; см stats.stackexchange.com/questions/230415/...
Я не вижу разногласий между моим комментарием и вашим ответом. Есть ли какая-либо математическая основа для дебатов Байеса и частых? , Под «математическим аппаратом» я понимаю то, что следует из аксиом Колмогорова; под «понятиями» я подразумеваю интерпретации как предельную частоту, степень убежденности и т. д.
Scortchi - Восстановить Монику
3

У меня нет строгих или философских оснований для ответа на этот вопрос, но я слышал жалобу «статистика - не математика», часто от людей, обычно физиков. Я думаю, что люди хотят гарантировать определенность от их математики, и статистика (обычно) предлагает только вероятностные выводы с соответствующими значениями p. На самом деле, это именно то, что я люблю в статистике. Мы живем в совершенно неопределенном мире и делаем все возможное, чтобы понять его. И мы делаем отличную работу, учитывая все обстоятельства.

Иордания
источник
2

Может быть, потому, что я - плебе и не изучал математические курсы, но не понимаю, почему статистика не математика. Аргументы здесь и по двойному вопросу, кажется, спорят о двух основных пунктах относительно того, почему статистика не математика * .

  1. Это не является точным / определенным, и поэтому полагается на предположения.
  2. Он применяет математику к задачам, и каждый раз, когда вы применяете математику, это больше не математика.

Не является точным и использует предположения

Допущения / приближения полезны для большого количества математики.

Я считаю, что свойства треугольника, о которых я узнал в начальной школе, считаются истинной математикой, хотя они и не верны в неэлюцидовой геометрии. Итак, ясно, что допустимость ограничений или иной способ «при условии, что XYZ является допустимым для следующего», для ветви математики не лишает ветви права быть «истинной» математикой.

Исчисление, я уверен, будет считаться чистой формой математики, но ограничения являются основным инструментом, на котором мы его построили. Мы можем продолжать рассчитывать до предела, точно так же, как мы можем продолжать увеличивать размер выборки, но ни один из них не дает более глубокого понимания превышения определенного порога.

Как только вы примените математику, это не математика

Очевидное противоречие здесь состоит в том, что мы используем математику для доказательства математических теорем, и никто не утверждает, что доказательство математических теорем не математика.

Следующее утверждение может быть thing xне математическим, если вы используете математические вычисления для получения результата. Это тоже не имеет никакого смысла.

Я бы согласился с тем утверждением, что когда вы используете результаты расчета для принятия решения, тогда это не математическое решение . Это не значит, что анализ, приведший к решению, не математика .

Я думаю, что когда мы используем статистический анализ, все выполненные математические вычисления - это настоящая математика. Только когда мы передаем результаты кому-то для интерпретации, статистика выходит из математики. Как таковые статистики и статистики занимаются реальной математикой и являются настоящими математиками. Это интерпретация, сделанная бизнесом и / или перевод результатов бизнесу статистиком, который не является математическим.

Из комментариев:

что сказал:

Если бы вы заменили «статистику» на «химию», «экономику», «инженерию» или любую другую область, в которой используется математика (например, домашняя экономика), похоже, ни один из ваших аргументов не изменится.

Я думаю, что ключевое различие между «химией», «разработкой» и «балансированием моей чековой книжки» состоит в том, что эти поля просто используют существующие математические понятия. Насколько я понимаю, такие статистики, как Гуасс, расширили круг математических понятий. Я считаю (это может быть явно неправильно), что для того, чтобы получить докторскую степень в области статистики, вы должны каким-то образом внести вклад в расширение совокупности математических понятий. Кандидаты в аспирантуру по химии и инженерии не предъявляют таких требований к моим знаниям.

Различие в том, что статистика вносит вклад в совокупность математических понятий, - это то, что отличает ее от других областей, которые просто используют математические понятия .


*: Заметным исключением является этот ответ, который фактически утверждает, что границы являются искусственными по различным социальным причинам. Я думаю, что это единственный верный ответ, но где в этом веселье? ;)

Эрика
источник
1
Если бы вы заменили «статистику» на «химию», «экономику», «инженерию» или любую другую область, в которой используется математика (например, домашняя экономика), похоже, ни один из ваших аргументов не изменится. Как таковой, кажется, без какой-либо субстанции.
whuber
Статистики PhD не должны «вносить вклад в совокупность математических понятий». Большинство стипендиатов PhD присуждаются за вклад в статистическую методологию и статистическую теорию. (Немногие математики, если таковые имеются, обращают внимание на статистическую литературу. Это просто не является хорошим источником новых или плодотворных математических идей в целом. Я не имею в виду литературу по теории вероятностей здесь.) Более того, химики, инженеры, физики и т. д. часто создают (или, как правило, воссоздают) математические идеи в своей работе; это не превращает их поля автоматически в разделы математики.
whuber
@whuber Это очень интересно. Похоже, что у меня нет ноги, чтобы стоять на.
Эрик
1
Для записи, я не понизил ваш вклад. Это деликатная тема для многих - например, многие математические факультеты колледжа все еще пытаются рассматривать статистиков как математиков в ущерб обоим - и поэтому, вероятно, вызовут некоторые сильные реакции.
whuber
2
@whuber Я достаточно силен, чтобы вынести несколько отрицательных голосов. :) Я думаю, что вы всегда были почтительны, так что не беспокойтесь об этом. Кроме того, голосование является анонимным по причине. Не нужно идти на запись.
Эрик
2

Статистические тесты, модели и инструменты логического вывода сформулированы на языке математики, и статистики математически доказали толстые книги очень важных и интересных результатов о них. Во многих случаях доказательства предоставляют убедительные доказательства того, что рассматриваемые статистические инструменты являются надежными и / или мощными.

Статистика и ее сообщество могут быть недостаточно «чистыми» для математиков определенного вкуса, но они определенно вкладываются в математику чрезвычайно глубоко, и теоретическая статистика - такая же отрасль математики, как теоретическая физика или теоретическая информатика.

Павел
источник
2
Привет, Пол, как вы говорите, статистика полна хороших теорем и доказательств (+1), есть даже аксиоматическая теория вероятности, разработанная Колмогоровым, как я объясняю в своем ответе.
-2

«Разница» зависит от: индуктивного мышления против дедуктивного мышления против умозаключения. Например, никакая математическая теорема не может сказать, какое распределение или априор вы можете использовать для своих данных / модели.

Кстати, байесовская статистика - аксиоматизированная область.

Compay Segundo
источник
Математика тоже нуждается в индуктивном мышлении ...
Элвис
@ Элвис Да, именно поэтому мой пример ... Я уверен, что вы знаете, что нет общего ответа на этот вопрос ... Я отредактировал ответ, для вашего удовольствия ...
Compay Segundo
Я действительно не понимаю твою точку зрения.
Элвис
@CompaySegundo: я не уверен, что у вас есть правильная точка зрения, по крайней мере, это не ясно указано.
Quora Feans
1
@QuoraFea Вероятно, я просто слишком пьян ...
Compay Segundo
-2

Это может быть очень непопулярным мнением, но, учитывая историю и формулировку понятий статистики (и теории вероятностей), я считаю статистику подотраслью физики .

Действительно, Гаусс первоначально формализовал модель регрессии наименьших квадратов в астрономических предсказаниях. Большую часть работ по статистике до Фишера внесли физики (или математики с большим числом применений, чьи работы будут называться физикой по сегодняшним меркам): Ляпунов, Де Моивр, Гаусс и один или несколько Бернулли.

Главным принципом является характеристика ошибок и кажущейся случайности, распространяемой из бесконечного числа неизмеренных источников вариаций. Поскольку эксперименты становились все труднее контролировать, экспериментальные ошибки должны были быть формально описаны и учтены для калибровки преобладания экспериментальных данных по сравнению с предложенной математической моделью. Позже, когда физика элементарных частиц углубилась в квантовую физику, формализация частиц как случайных распределений дала гораздо более краткий язык для описания кажущейся неконтролируемой случайности с фотонами и электронами.

Свойства оценок, такие как их среднее значение (центр масс) и стандартное отклонение (второй момент отклонений), очень интуитивно понятны для физиков. Большинство предельных теорем могут быть слабо связаны с законом Мерфи, то есть, что предельное нормальное распределение является максимальной энтропией.

Таким образом, статистика является одной из отраслей физики.

Adamo
источник
5
Этот тезис настолько же неправдоподобен, сколь и нелогичен. Как Стивен Стиглер указывает в своих книгах, психологов, экономистов, и большинство других обществоведы не не применять методы физиков в течение до другого столетия из - за реальных сомнений относительно их применимости и их интерпретации. Это убедительное доказательство того, что статистика - это не просто раздел физики. Другие дисциплины, от инженерии до биологии, также используют физические методы и физические теории, но это также не делает их ветвями физики - по крайней мере, ни в каком значительном или проницательном смысле.
whuber
Разве интерес Бернулли к вероятности не был связан с азартными играми, а не с физикой?
Дикран Сумчатый
@whuber Как и в моей области, биостатистики, я хорошо знаю, что эти прикладные науки существовали в различных формах до их четкой идентификации в качестве области науки. Я полагаю, что этим областям формально предшествовало поле самой статистики. Это, конечно, не относится к физике. Одна центральная тема в этих прикладных науках - формулирование процесса как модели, связывающей некий предиктор с ответом. Возможно, язык статистики был отчасти обусловлен необходимостью обобщения таких понятий, которые применимы к этим областям.
AdamO
1
Вы думаете о Якобе Бернулли, посмертном авторе ars conjectandi (изд. Николас Бернулли, 1713). Вероятно, последними людьми, которые, казалось, были мотивированы проблемами с азартными играми, были Паскаль и Ферма в 1654 году, но даже тогда кажется, что они использовали определенные проблемы с азартными играми («проблема очков») только в качестве мотивационного примера, а не в качестве центра внимания. их расследование. (Современная наука фактически прослеживает проблему пунктов исламского договорного права ок. 1200 г.) Последним заметным математиком, который действительно был мотивирован азартными играми, вероятно, был Кардано (1501-1576).
whuber
1
Диаконис маг ? Я бы не стал отождествлять азартные игры с зрелищностью! У вас есть точка зрения, но вы могли бы отодвинуться немного лучше, предположив, что многие «инвесторы» на самом деле являются игроками, поскольку многие теоретики в области математических финансов могут действительно мотивироваться этой формой азартных игр. Просто мысль ... Во всяком случае, ясно, что к тому времени, когда Гюйгенс опубликовал свой небольшой трактат в 1657 году, люди создавали теорию вероятностей (и статистику) по причинам гораздо более глубоким и далеко идущим, чем лучше за игровыми столами. ,
whuber