Я узнал, что статистика - это атрибут, который вы можете получить из выборок. Взяв множество выборок одинакового размера, рассчитав этот атрибут для всех из них и построив график в формате PDF, мы получим распределение соответствующего атрибута или распределение соответствующей статистики.
Я также слышал, что статистика делается для оценки, как эти два понятия отличаются?
Ответы:
Определение
Из Википедии:
А также
Важным отличием является:
(Что означает «количество», см. Раздел ниже.)
Статистика не является оценщиком
Оценщик является статистика с чем - то добавляется. Чтобы превратить статистику в оценщик, вы просто указываете, какое целевое количество вы хотите оценить. Это сбивает с толку, потому что вы не добавляете ничего «реального» в статистику, а только некоторые намерения.
Чтобы увидеть, что разница важна, вы должны понимать, что вы не можете рассчитать свойства оценки (например, смещение , дисперсия и т. Д.) Для простой статистики. Чтобы рассчитать смещение , вы должны найти разницу между значением, которое дает вам ваша статистика, и истинным значением. Только оценщик имеет «истинное значение», которое позволяет вычислить смещение. Статистика - это просто функция данных, и она не является ни правильной, ни неправильной.
Различные оценки на основе одной и той же статистики
Вы можете указать разные целевые величины для одной и той же статистики, что приведет к различным оценкам. Каждый такой оценщик имеет свое собственное смещение, хотя все они (на основе) имеют одинаковое значение, одну и ту же статистику.
Поэтому говорить «образец означает беспристрастность» не имеет смысла. Среднее значение выборки является непредвзятым, когда вы используете его для оценки среднего значения распределения. Но в то же время он смещен при использовании его для оценки дисперсии распределения.
Количество распределений и количество образцов
Здесь количество относится к некоторому свойству распределения, которое обычно неизвестно и поэтому должно быть оценено. Это противоречит статистике , которая является свойством выборки, например, среднее значение распределения - это количество вашего распределения, а среднее значение выборки - статистика (количество вашей выборки).
источник
Эта ветка немного старая, но похоже, что Википедия, возможно, изменила свое определение, и если она точна, она объясняет это более четко для меня:
Таким образом, статистика относится к самим данным и расчету с этими данными. В то время как оценщик относится к параметру в модели.
Если я правильно понимаю, тогда среднее значение является статистическим, а также может быть оценкой. Среднее значение выборки представляет собой статистику (сумма выборки, деленная на размер выборки). Среднее значение выборки также является оценкой среднего значения популяции, при условии, что оно нормально распределено.
Я бы спросил @whuber и других, кто действительно знает этот материал, если (новая?) Цитата из Википедии точна.
источник
Поскольку другие ответы о том, что они одинаковые, не дают авторитетных ссылок, позвольте мне привести две цитаты из справочника Статистического вывода Каселлы и Бергера:
а также
Я не говорю здесь, что это определенный ответ на вопрос, так как я, кажется, согласен с двумя наиболее одобренными ответами, которые предполагают, что есть различие, просто давая ссылку, которая говорит противоположное, чтобы подчеркнуть, что это не четкий случай.
источник
«6» является примером оценки. Скажите, что ваш вопрос был: "Каков наклон наилучшей линейной функции, отображающей x на y?" Ваш ответ может быть "6". Или это может быть . Оба являются оценщиками. Какой из них лучше, решать вам.(X′X)−1X′Y
Действительно хороший ТА однажды объяснил мне концепцию оценки таким образом.
По сути, оценщик - это то, что вы применяете к данным, чтобы получить количество, значение которого вы не знаете. Вы знаете значение статистики - это функция данных, в которой нет «лучших» или «оптимальных» данных. Не существует «лучшего» средства. Это просто среднее.
Скажем, у вас есть набор данных о количестве коз, принадлежащих человеку, и о счастье каждого человека. Вы интересуетесь тем, как меняется счастье людей в зависимости от количества коз, которыми они владеют. Оценщик может помочь вам оценить эти отношения на основе ваших данных. Статистика - это просто функция данных, которые у вас есть. Например, дисперсия владения козой может равняться 7. Те формулы для расчета дисперсии будут одинаковыми между козами и тостерами, или вы заинтересованы в счастье или склонности к раку. В этом смысле все разумные оценки являются статистикой.
источник
Интересный вопрос. Оценки и статистика не должны быть разными вещами. Это разные понятия.
Статистика - это функция (в широком смысле), в которую вводятся (статистические) данные. В результате вы получаете результат, обычно число, из этой статистики. В более абстрактном термине статистика может давать более одного числа. Статистика зависит от данных, но процедура является детерминированной. Таким образом, статистика может быть такой: «Суммируйте все числа и разделите на счет» или, в более широком смысле, «возьмите данные ВВП и подготовьте отчет по ним».
В статистическом смысле мы, конечно, говорим о математической функции как статистике.
Значение этого заключается в том, что если вы знаете свойства введенных вами данных (например, это случайная переменная), то вы можете вычислить свойства вашей статистики, фактически не вводя эмпирические данные.
Оценщики являются оценщиками из-за вашего намерения: оценить недвижимость. Оказывается, некоторые статистические данные являются хорошими оценщиками.
Например, если вы извлекаете точки данных из пула переменных iid, то среднее арифметическое - статистика, основанная на данных, которые вы извлекаете, вероятно, будет хорошей оценкой ожидаемого значения этого распределения. Но опять же, любая вещь, которая производит оценку, является оценщиком.
На практике используемые вами оценки будут статистикой, но есть статистика, которая не является оценщиками. Например, статистика тестов - хотя можно поспорить о семантике этого утверждения и, что еще хуже, статистика тестов может не только быть, но и включать оценки. Хотя концептуально это не должно иметь место.
И, конечно, у вас могут быть оценки, которые не являются статистикой, хотя, вероятно, они не очень хороши в оценке.
источник
Я думаю, что лучшее понимание о том, что образец помогает.
[Обновлено: выборка - очень широкое понятие, я говорил о «случайной выборке». Я не знаю, имеет ли смысл оценка или нет, когда выборка не случайна .]
из википедии :
Мы заменим выборку в оценке на значение выборки. Мы получаем значение оценки, это конкретная мера. И эта конкретная мера является статистикой.
(Проверьте эту ссылку для определения оценки, последнее предложение показывает, почему мы всегда в замешательстве.)
источник
Цель этого произведения:
Здесь я хочу предоставить вам сходства и различия между двумя тесно связанными понятиями, называемыми «статистикой» и «оценщиком». Однако я не хочу анализировать различия между параметром и статистикой, которые, как я полагаю, достаточно понятны для всех, кто борется с различиями между статистикой и оценщиком. Если это не так, вам нужно сначала изучить предыдущие посты, а затем начать изучать этот пост.
Отношения:
По сути, любая вещественная функция наблюдаемых случайных величин в выборке называется статистикой. Существуют некоторые статистические данные о том, что, если они хорошо спроектированы и имеют некоторые хорошие свойства (например, согласованность, ...), они могут использоваться для оценки параметров базового распределения населения. Поэтому статистика - это большой набор, а оценки - это подмножество в наборе статистики. Следовательно, каждая оценка является статистикой, но не каждая статистика является оценкой.
сходства:
Говоря о сходстве, как упоминалось ранее, оба являются функциями случайных величин. Кроме того, оба имеют распределения, называемые «выборочные распределения».
Отличия:
Говоря о различиях, они разные с точки зрения их целей и задач. Цели и задачи статистики могут заключаться в обобщении информации в выборке (с использованием достаточной статистики), а иногда в проведении проверки гипотез и т. Д. Напротив, основная цель и задача оценщика, как следует из его названия, состоит в оценке параметры изучаемой популяции. Важно отметить, что существует большое разнообразие оценок, каждый из которых имеет свою собственную вычислительную логику, такую как MOMEs, MLE, оценки OLS и так далее. Другое различие между этими двумя понятиями связано с их желаемыми свойствами. В то время как одним из наиболее желательных свойств статистики является «достаточность», желаемыми свойствами оценщика являются такие вещи, как «согласованность», «непредвзятость», «точность» и т. Д.
Внимание:
Следовательно, вам необходимо соблюдать осторожность при использовании терминологии при работе со статистикой и оценщиками. Например, не имеет смысла говорить о предвзятости простой статистики, которая ни в коем случае не является оценщиком, потому что в таком контексте нет параметра, который позволял бы нам рассчитывать смещение, и Поговори об этом. Таким образом, вы должны быть осторожны с терминологией!
Суть:
Подводя итог, любая функция наблюдаемых случайных величин в выборке является статистикой. Если статистика имеет возможность оценить параметр совокупности, то мы называем ее оценщиком (представляющего интерес параметра). Однако, есть некоторые статистические данные, которые не предназначены для оценки параметров, поэтому эти статистические данные не являются оценщиками, и здесь мы называем их «простой статистикой».
То, что я предложил выше, это то, как я смотрю и думаю об этих двух понятиях, и я изо всех сил старался выразить это простыми словами. Я надеюсь, что это помогает!
источник
Новый ответ на старый вопрос:
Определение 1. статистика является функцией , которая отображает каждый образец для вещественного числа.
Каждый оценщик является статистикой.
Но мы склонны называть только те статистические данные, которые используются для генерации оценок («догадок»), некоторым параметром оценщика.
Так, например, t-статистика и среднее значение выборки - ОБА статистика. Среднее значение выборки также является оценкой (потому что мы часто используем его для оценки истинного среднего значения популяции).
Напротив, мы редко / никогда не называем t-статистику оценщиком, потому что мы редко / никогда не используем ее для оценки какого-либо параметра.
источник
При проверке гипотез :
Тест-статистика о проверке гипотез. Тест-статистика - это случайная величина, заданная / согласно нулевой гипотезе. Теперь некоторые могут назвать статистику значением / мерой тест-статистики для данной выборки.
С этими двумя вы можете получить значение p, которое является мерой, которая помогает отклонить или не отклонить нулевую гипотезу. В общем, статистика - это оценка того, насколько далеко / близко к вашей гипотезе.
Эта ссылка может быть полезной.
источник