Как описать статистику в одном предложении?

27

Когда я впервые начал изучать статистику, такие процедуры, как t-тест, ANOVA, хи-квадрат и линейная регрессия, казались совершенно разными существами. Но теперь я понимаю, что эти процедуры делают более или менее одно и то же. Кроме того, такие значения, как дисперсия, остатки, стандартная ошибка и среднее значение, также измеряют более или менее одно и то же.

Поэтому я считаю, что все эти процедуры и значения, а также вся статистика, могут быть описаны одним простым предложением:

Каково ожидаемое значение и как изменяется это значение?

Ожидаемое слово может быть заменено любым из этих слов: предполагаемое, предсказанное или центральное.

Как другие люди описывают статистику в одном предложении?

luciano
источник
10
@Trynna Это описание далеко слишком узок: он характеризует оценку только точку. Это все равно, что описывать математику как сложение и умножение чисел, что вполне может быть подходом для человека, который несколько лет изучал арифметику в школе, но далеко не соответствует тому, что входит в эту область.
whuber

Ответы:

26

Статистика предоставляет обоснование и методы для производства и понимания данных.

Американская Статистическая Ассоциация

whuber
источник
+1 Я пытался придумать выражение чего-то очень близкого к этому понятию. Я бы добавил кое-что о том, чтобы прийти к выводам на основе данных, но это не совсем так кратко.
Glen_b
3
@ Глен: Вы можете сказать, что в эту характеристику было вложено много мыслей. Мне нравится иметь это здесь где-то на нашем сайте. Это и аналогичное подробное описание машинного обучения должны присутствовать на наших страницах справки.
whuber
2
Я не уверен, что согласен с цитатой (хотя это прекрасное стремление). Как эпидемиолог, я знаю, что знаю кое-что о дизайне исследования и производстве данных и причинно-следственных связей вокруг них, что находится за пределами понимания многих прекрасных статистиков вокруг меня. Действительно, причудливый причинно-следственный вывод для рекурсивных причинно-следственных графиков возник в трех областях, не названных статистикой (эпидемиология, информатика и социология, насколько я понимаю). Не поднимая это в воинственном духе, но потому что цитируемое предложение описывает большую часть науки , и не фиксирует статистику как таковую .
Алексис
3
Описание ASA гораздо больше о статистике как области человеческих знаний и деятельности, а не о том, кем может быть «статистик». До Второй мировой войны профессиональные статистики были редкостью, но это не значит, что статистика не применялась в коммерческих и академических условиях. Я не думаю, что хорошее определение статистики может быть ограничено тем, что делают профессиональные статистики.
Серебряная рыбка
1
@Alexis Возможно, есть некоторые трудности с уровнем понимания, подразумеваемым словом «понимание», которое определение ASA оставляет довольно двусмысленным в своей краткости. Более широкое толкование может быть слишком всеобъемлющим. Конечно, если мы включим материальную или социальную интерпретацию и лежащие в ее основе механизмы как часть «понимания», то это выходит за рамки «простой» статистики. С другой стороны, мне непонятно, почему вывод из данных, причинных или иных, не может лежать в областях как научной, так и статистической деятельности.
Серебряная рыбка
13

Статистика в основном связана с пониманием структуры данных.

Билл Венейблс и Брайан Рипли, первое предложение в главе 1 современной прикладной статистики с S

mark999
источник
1
Это интересный взгляд на статистику, хотя и ограниченный. Возможные двусмысленности показывают: ученый-компьютер будет понимать «структуру данных» нестатистическим способом. (Венейблс и Рипли работают на пересечении статистики и вычислений.)
whuber
@whuber Я согласен с тобой. Ничто не говорит о том, что V & R задумал, чтобы это было описание всей статистики в одном предложении, но с тех пор, как я впервые прочитал его, я подумал, что это хорошее описание. Я интерпретирую «структуру в данных» как «характеристики населения, из которого была взята выборка».
mark999
10

Статистика предоставляет обоснование и методы для преобразования данных в значимую информацию.

оборота IrishStat
источник
8

По словам покойного Льва Бреймана:

Цели в статистике - использовать данные для прогнозирования и получения информации о базовом механизме данных.

http://projecteuclid.org/euclid.ss/1009213726

Ричард Бордер
источник
5

Лично мне нравится следующая цитата Стивена Сенна в Dicing with death. Шанс, риск и здоровье (издательство Кембриджского университета, 2003). Я выделил одно (или два) предложение, которое, как мне кажется, резюмирует его основной смысл, хотя весь абзац стоит прочитать.

Статистика есть и статистика есть.
Статистика, в единственном числе, вопреки распространенному мнению, на самом деле не о фактах; Речь идет о том, как мы знаем, или подозреваем, или верим, что что-то является фактом. Поскольку знание о вещах подразумевает их подсчет и измерение, то, действительно, статистическое множественное число является частью проблемы статистики, которая является наукой о количественных рассуждениях. Эта наука имеет гораздо больше общего с философией (в частности эпистемологией), чем с бухгалтерским учетом. Статистики являются прикладными философами. Философы утверждают, сколько ангелов может танцевать на иголке; статистика рассчитывает их . Или , вернее, посчитайте , сколько может , вероятно , потанцевать.Вероятность - это сердце материи, сердце всей материи, если верить квантовым физикам. Что касается статистики, это правда, является ли мир строго детерминированным, как считал Эйнштейн, или существует остаточная неизбежная неопределенность. Мы не можем ничего предсказать с уверенностью, но мы можем предсказать, насколько неопределенными будут наши прогнозы, в среднем это так. Статистика это наука, которая говорит нам, как.

хл
источник
5

Статистика - это наука об изучении данных, измерении, контроле и передаче информации о неопределенности.

Мари Давидян и Томас Луи

Они продолжают:

; и тем самым обеспечивает навигацию, необходимую для контроля хода научных и общественных достижений.

Momo
источник
Мне нравится это определение, потому что оно выделяет аспект «неопределенности». Вторая часть хороша тем, что в ней говорится, что статистика существует не только сама по себе, но ее следует рассматривать в более широком контексте. Однако, чтобы быть полностью удовлетворенным, я мог бы объединить это с ASA:
Момо
1
Статистика как наука об изучении данных и измерении, контроле и передаче информации о неопределенности обеспечивает обоснование и методы получения и понимания данных.
Момо
2

Статистика - это набор методов и способов мышления, которые помогают людям делать четкие выводы из шумной информации.

Майкл Лью
источник
2

Поскольку мы не богоподобные всезнающие существа, нам приходится иметь дело с неопределенностью, и Статистика предоставляет методы для учета и отражения этой неопределенности.

elevendollar
источник
2

статистика является областью философии, которая занимается следующим вопросом «как мы учимся на основе наблюдений», используя строгие математические концепции.

просто примечание, которое вы можете сделать «одним предложением» очень длинным, есть книга, написанная Б. Грабалом, которая состоит из одного длинного предложения, см. «Уроки танцев для старших по возрасту»

стопа
источник
2

Статистика - это наука о неопределенности и технология извлечения информации из данных.

Дэвид Дж. Хэнд

Момо
источник
2

Статистика - это набор логических принципов и математических методов для подведения количественной информации точными и актуальными способами.

SQLServerSteve
источник
1

Моими словами

Statistics is the science of what might be

Это своего рода насмешливый .

MCP_infiltrator
источник
1
Если бы вы замаскировали первое слово и попросили людей заполнить пробел, я подозреваю, что «статистика» не будет первой вещью, которую они придумают - и, возможно, не вторым или третьим. «Футурология», «спекуляция», «научная фантастика» и, может быть, - чуть ближе к вашим намерениям - «предсказание» и «прогнозирование» - вероятно, будут популярным выбором. Даже «онеология» и «апотропизм» были бы возможностями. :-)
whuber
1

Фишер ( 1922 ) дал свою точку зрения на суть статистики в следующей цитате (жирный шрифт добавлен мной для требования одного предложения ):

Чтобы прийти к четкой формулировке статистических задач, необходимо определить задачу, которую ставит перед собой статистик: кратко и в наиболее конкретной форме объектом статистических методов является сокращение данных . Количество данных, которое, как правило, просто не может войти в ум, должно быть заменено сравнительно небольшим количеством, которое должно адекватно представлять целое или которое, другими словами, должно содержать как можно больше, в идеале, целое , соответствующей информации, содержащейся в исходных данных.

ekvall
источник
0

Ориентированная на результат (и поэтому не совсем описательная ) однострочность была бы для меня

Статистика - это то, что заставляет мир вращаться, независимо от того, что делает то же самое для Природы.

Алекос Пападопулос
источник
3
Вы путаете статистику с политикой? Или, может быть, с любовью?
whuber
@whuber (+1) Нет. Оба принимают большинство решений на основе статистики, независимо от того, осознают они это или нет.
Алекос Пападопулос
2
Я вижу это сейчас, в следующем фильме, когда ведущий мужчина встает на колени, чтобы предложить: «Детка, ты моя UMVUE, ты выйдешь за меня?» :-) (Давайте воспользуемся оценкой усадки и свяжем наши коэффициенты вместе ...)
uuber
@whuber (+2) ... это часть "не осознай этого": это именно то, что означает мужской лидер , даже если он не использует язык! (Я допускаю, что могу быть виноват здесь в философском империализме).
Алекос Пападопулос
2
Ваш глубоко респектабельный культурный фон (поскольку ваше имя и местоположение позволяют сделать вывод о нем), который можно проследить, по крайней мере, до ранних софистов, дает вам немного широты в этом отношении. :-)
whuber
0

Статистика - это инструмент для моделирования генерации данных с помощью неопределенных и / или вероятностных процессов.

thecity2
источник
-1

Статистика о пытках данных достаточно долго, пока они не признаются в том, что вы хотите показать.

Я перефразирую Рональда Коуза, смотрите ссылку

ксеон
источник
-1, это было задумано как язык в щеке?
gung - Восстановить Монику
@ Да, и нет, я цитировал Рональда Коуза.
Владислав Довгальец
3
Исходя из версии здесь , это в лучшем случае плохой пересказ. Это не очень хорошее краткое изложение того, что такое статистика.
gung - Восстановить Монику
3
@ хорошо, ОП спросил, как разные люди будут это описывать. Это всегда будет его или ее точка зрения или мнения. Это будет отличаться для разных людей. ОП постарался собрать разные мнения ИМХО.
Владислав Довгальец
2
xeon было бы очень приятно, если бы Коуз отредактировал ваш ответ, чтобы правильно процитировать и указать источник.
Алексис
-2

Статистика - это математическая наука, которая позволяет выяснить, является ли разница между наборами наблюдений случайной или нет.

Sympa
источник
1
Описывает узкое подмножество того, что представляет собой поле.
rolando2
Я вижу это по-другому. В конечном счете, независимо от того, проводите ли вы тестирование гипотез, регрессионное моделирование или любую другую оценку, вы чаще всего измеряете, является ли разница между вашей оценкой и наивной моделью или разница в наблюдениях статистически значимой или нет. Мое предложение отражает суть статистической значимости и случайности. Если другие согласны, можете ли вы дать мне несколько голосов, поэтому мой комментарий, который легко оправдан, не рассматривается как простой неправильный ответ только из-за субъективной интерпретации ограниченности одного человека.
Симпа
2
Пожалуйста, рассмотрите эти типы вопросов, на которые часто пытаются ответить, используя статистику: Какова форма этого распределения? Какова природа отношений между этими двумя переменными? Как можно сгруппировать эти многочисленные переменные, чтобы мы могли видеть общие проблемы / темы / темы / измерения? Как можно сгруппировать эти многочисленные случаи, чтобы мы могли видеть общие типы / профили? Как лучше всего описать эту сеть отношений с прицелом на причинность? Что отражает тенденцию этой переменной во времени? Каков наилучший способ прогнозировать будущие значения?
rolando2
В каждом из этих случаев ответ на эти вопросы имеет сильный элемент статистической значимости, и то, отличается ли то, на что вы смотрите в той или иной форме, от того, что может произойти из-за случайности. Для большинства из нас отрицательный голос означает явно неправильный ответ. Я не понимаю, как мой ответ можно классифицировать как таковой.
Симпа
1
Текст при наведении курсора на стрелку вниз гласит: «этот ответ бесполезен». Я нахожу это интересным - и поэтому не бесполезным - потому что это заставляет задуматься, но я не проголосовал за это по нескольким причинам. Во-первых, утверждение о том, что статистика - это «математическая наука»: это очень неудобно близко к заблуждению (особенно среди некоторых математиков), что статистика - это просто раздел математики. Второе - это то, что он, кажется, только характеризует проверку гипотез с двумя выборками, которая является очень узкой (хотя и распространенной) частью статистики.
whuber