В чем разница между описательной и логической статистикой?

21

Насколько я понимаю, описательная статистика количественно описывает особенности выборки данных, в то время как логическая статистика делает выводы о группах населения, из которых были взяты выборки.

Тем не менее, страница Википедии для статистического вывода состояний:

По большей части статистический вывод делает предположения о популяциях, используя данные, взятые из интересующей популяции через некоторую форму случайной выборки.

«По большей части» заставило меня подумать, что я, возможно, неправильно понимаю эти концепции. Есть ли примеры выводной статистики, которая не делает предположений о населении?

user1205901 - Восстановить Монику
источник
Описательная статистика: монета подбрасывалась десять раз, а головы падала шесть раз. Статистический вывод: максимальная оценка вероятности вероятности головы равна , или, этой информации недостаточно, чтобы опровергнуть гипотезу о том, что монета является честной монетой. 0.6
Дилип Сарват
2
Вывод без понятия «популяция»: предположим, что ваши данные генерируются неким (частично) неизвестным случайным механизмом / правилом. Инференциальные методы позволяют оценить свойства этого механизма на основе данных. Пример: вы хотите проверить электрофизическую формулу на основе результатов, которые могут быть измерены только приблизительно или в несовершенных условиях.
Майкл М
1
@ Майкл: Да; или действительно заставить ваши данные генерироваться с помощью известного случайного механизма - случайного назначения экспериментального лечения.
Scortchi - Восстановить Монику

Ответы:

19

Исходя из опыта в области поведенческих наук, я ассоциирую эту терминологию, в частности, с учебниками по вводной статистике. В этом контексте различие заключается в том, что:

  • Описательная статистика - это функции выборочных данных, которые по сути интересны при описании некоторых характеристик данных. Классическая описательная статистика включает среднее, минимальное, максимальное, стандартное отклонение, медиана, перекос, эксцесс.
  • Логическая статистика - это функция выборочных данных, которая помогает сделать вывод относительно гипотезы о параметре совокупности. Классическая логическая статистика включает z, t, , F-коэффициент и т. Д.χ2

Важным моментом является то, что любая статистика, выводная или описательная, является функцией выборочных данных. Параметр - это функция совокупности, где термин совокупность совпадает с произнесением базового процесса генерации данных.

С этой точки зрения статус данной функции данных в качестве описательной или логической статистики зависит от цели, для которой вы ее используете.

При этом некоторые статистические данные явно более полезны для описания соответствующих характеристик данных, а некоторые хорошо подходят для облегчения вывода.

  • Статистическая статистика: Стандартная тестовая статистика, такая как t и z, для заданного процесса генерирования данных, где нулевая гипотеза ложна, ожидаемое значение сильно зависит от размера выборки. Большинство исследователей не считают такую ​​статистику оценкой популяционного параметра, представляющего естественный интерес.
  • Описательная статистика . В отличие от описательной статистики, оценивают параметры популяции, которые обычно представляют интерес. Например, среднее значение выборки и стандартное отклонение обеспечивают оценки эквивалентных параметров популяции. Даже описательные статистические данные, такие как минимальное и максимальное значения, предоставляют информацию об эквивалентных или аналогичных параметрах совокупности, хотя, конечно, в этом случае требуется гораздо больше внимания. Кроме того, многие описательные статистические данные могут быть предвзятыми или иными, чем идеальные оценки. Тем не менее, они все еще имеют некоторую полезность в оценке интересующего параметра населения.

Таким образом, с этой точки зрения, важные вещи для понимания:

  • статистика : функция выборочных данных
  • параметр : функция населения (процесс генерации данных)
  • оценщик : функция выборочных данных, используемая для оценки параметров
  • умозаключение : процесс вывода заключения о параметре

Таким образом, вы можете либо определить различие между описательным и логическим выводом на основе намерения исследователя использовать статистику, либо вы можете определить статистику на основе того, как она обычно используется.

Джером англим
источник
Как оправданно называть t- или F- баллы (а не, например, t- тесты ) выводной статистикой?
13
@jona t-оценка - это «статистика», которая используется в t-тесте, поэтому можно описать t-оценку как выводную статистику, когда она используется как часть такого вывода. Я предполагаю, что я начал с предположения, что статистика является функцией данных. Но, может быть, вы намекаете на то, что мы часто думаем о статистике логического вывода как о более широком наборе методов, используемых для вывода?
Jeromy Anglim
Позвольте мне сформулировать это по-другому - не является ли t-статистика описанием образца, а не логическим выводом (таким как значение p)?
13
Ну да, функция данных эквивалентна описанию образца. Я думаю, я думал, что такая статистика используется в логическом процессе (например, исследователи связывают t-статистику с t-распределением, чтобы получить p-значение, а затем связывают p с альфа, чтобы сделать вывод). Я часто видел учебники, использующие эти примеры. Но я полагаю, что p-значение и сам двоичный вывод можно рассматривать как статистику (то есть функции выборочных данных). И сам бинарный вывод можно было бы рассматривать как наиболее четко выровненный с выводом. Это то, что вы получаете?
Jeromy Anglim
1
Так, например, вы используете данные, чтобы добраться до t, которое связано с распределением, которое дает вам p , что, в свою очередь, дает двоичный вывод о параметре совокупности. Таким образом, с точки зрения частоты, t, p и двоичный вывод - все случайные величины. Все были вовлечены в процесс вывода. Я не уверен, каковы плюсы и минусы маркировки всей или только такой статистики как выводной.
Джером Энглим
8

Одна из форм вывода основана на случайном назначении экспериментальных методов лечения, а не на случайной выборке из популяции (даже гипотетически). Оскар Кемпторн был сторонником.

AВTT10/252знак равно0.04

Прогнозирование - это еще одна область, где вы не обязательно формулируете предложения о населении. (Я не знаю, что все хотели бы назвать предсказание «выводом», но есть Geisser (1993), Predictive Inference: Введение ). Часто предсказание следует из модели приспособленного населения, но не всегда; например, @ пример классификации Мэтта, усреднение модели (байесовское или на основе весов Акаике) или алгоритмы прогнозирования, такие как экспоненциальное сглаживание.

NB. Я думаю, что «логическая логика относительно описательной статистики» чаще относится к статистике дисциплины, а не к количествам, рассчитанным по выборкам. Нет существенной разницы между логической и описательной статистикой; как указал @Jeremy, вопрос в том, для чего вы его используете.

Scortchi - Восстановить Монику
источник
2

Я не уверен, что классификация обязательно делает заявление о населении (ях), из которого взяты данные. Классификация, как вы, вероятно, знаете, использует обучающие данные, состоящие из некоторых векторов «признаков», каждый из которых помечен определенным классом, для прогнозирования меток классов, принадлежащих другим векторам без меток. Например, мы могли бы использовать основные показатели жизнедеятельности пациента и диагноз врача, чтобы предсказать, являются ли другие пациенты здоровыми или больными.

п(учебный классзнак равнос|функции)с

Однако другие классификаторы ищут различия между классами без моделирования самих классов; они называются дискриминационными классификаторами. Одним классическим примером является классификатор ближайшего соседа, который присваивает немаркированный пример классу своего ближайшего соседа (где близость определена некоторым разумным способом для проблемы). Похоже, это не содержит много информации, если таковой вообще имеется, о группах населения, из которых были получены точки данных.

T

Мэтт Краузе
источник
0

В одной строке, учитывая данные, описательная статистика пытается обобщить содержание ваших данных с минимальной потерей информации (в зависимости от того, какую меру вы используете). Вы можете увидеть географию данных (что-то вроде, посмотреть график производительности класса и сказать, кто сверху, снизу и т. Д.)

В одной строке, учитывая данные, вы пытаетесь оценить и сделать вывод о свойствах гипотетической совокупности, из которой поступают данные. (Что-то вроде понимания учеников 7-го класса с помощью хорошей выборки из класса, предполагая, что базовая популяция достаточно велика, чтобы их нельзя было полностью учесть)

Вани
источник
3
Я не думаю, что это определение или характеристика описательной статистики, которая направлена ​​на минимальную потерю информации. Вполне возможно иметь описательную статистику, которая исключает действительно важные детали, и это часто является проблемой.
Ник Кокс
0

Короче

Описательная статистика - это анализ данных, которые описывают, показывают или обобщают данные в значимой форме; Это просто способ описать наши данные / говорить о всей популяции. некоторые из них - Меры центральной тенденции и Мера рассеивания

Инференциальная статистика - это метод, который позволяет нам использовать выборки для обобщения совокупностей, из которых были взяты выборки. Пример тестирования гипотез и

Фрехивот Мулугета
источник
0

описательная статистика - это анализ данных, которые описывают, показывают или обобщают данные в значимой форме; Это просто способ описать наши данные / говорить о всей популяции. некоторые из них - Меры центральной тенденции и Мера рассеивания

Инференциальная статистика - это метод, позволяющий нам использовать выборки для обобщения совокупностей, из которых были взяты выборки. Пример тестирования гипотез и совместное совершенствование этого ответа

Нуру Мустефа
источник
Добро пожаловать в Cross Validated ! Пожалуйста, найдите время, чтобы посмотреть наш тур . Похоже, вы собирались закончить хороший ответ, но что-то случилось. не стесняйтесь редактировать свой ответ, чтобы завершить свою мысль. Вы также можете улучшить свой ответ, добавив цитаты / ссылки, которые объединяют то, что вы разместили здесь. Вам также нужно ответить на вопрос «Существуют ли примеры логической статистики, которая не делает предположений о населении?»
Таврок,