Этот вопрос лежит в основе того, что такое статистика и как проводить хороший статистический анализ. Это поднимает много вопросов, некоторые из терминологии и другие из теории. Чтобы прояснить их, давайте начнем с обозначения неявного контекста вопроса и продолжим, чтобы определить ключевые термины «параметр», «свойство» и «оценщик». Ответы на несколько частей вопроса возникают по мере их обсуждения. Заключительный заключительный раздел суммирует ключевые идеи.
Государственные пространства
Распространенное статистическое использование "распределения", как в "нормальном распределении с PDF, пропорциональным "на самом деле является (серьезным) злоупотреблением английским, потому что, очевидно, это не одно распределение: это целое семейство распределений,параметризованныхсимволамиμиσ. Стандартные обозначения для это «пространство состояний»Ω,множествоехр( - 12( х - μ ) / σ)2) гИксμσΩраспределений. (Я здесь немного упрощаюсь ради изложения и буду продолжать упрощаться по мере нашего продвижения, оставаясь при этом максимально строгим.) Его роль заключается в определении возможных целей наших статистических процедур: когда мы что-то оцениваем, мы выбирая один (или иногда больше) элементов из .Ω
Иногда пространства состояний явно параметризованы, как в . В этом описании существует взаимно-однозначное соответствие между набором кортежей { ( μ , σ ) } в верхней полуплоскости и набором распределений, которые мы будем использовать для моделирования наших данных. Одно из значений такой параметризации состоит в том, что теперь мы можем конкретно ссылаться на распределения в Ω посредством упорядоченной пары действительных чисел.Ω = { N( μ , σ2) | µ ∈ R , σ> 0 }{ ( μ , σ) }Ω
В других случаях пространства состояний не являются явно параметризованными. Примером может служить множество всех унимодальных непрерывных распределений. Ниже мы рассмотрим вопрос о том, можно ли в любом случае найти адекватную параметризацию в таких случаях.
параметризация
Как правило, параметризация из , является соответствие (математическая функция ) из подмножества R д (с г конечна) , чтобы Ом . То есть он использует упорядоченные наборы d- кортежей для маркировки распределений. Но это не просто переписка: это должно быть "хорошо себя вести". Чтобы понять это, рассмотрим множество всех непрерывных распределений, чьи PDF-файлы имеют конечные ожидания. Это будет широко рассматриваться как «непараметрический» в том смысле, что любая «естественная» попытка параметризации этого набора будет включать счетную последовательность действительных чисел (используя разложение в любом ортогональном базисе). Тем не менее, потому что этот набор имеет мощность ℵΩрddΩd , который является мощность переАльса, должен существовать какойто один-к-однозначное соответствие между этими распределений и R . Как это ни парадоксально, казалось бы, это делаетпараметризованноепространство состояний соднимреальным параметром!ℵ1р
Парадокс разрешается, отмечая, что одно действительное число не может иметь «хороших» отношений с распределениями: когда мы меняем значение этого числа, распределение, которому оно соответствует, в некоторых случаях должно меняться радикальным образом. Мы исключаем такие «патологические» параметризации, требуя, чтобы распределения, соответствующие близким значениям их параметров, сами были «близки» друг к другу. Обсуждение подходящих определений «close» привело бы нас слишком далеко, но я надеюсь, что этого описания достаточно, чтобы продемонстрировать, что быть параметром гораздо больше, чем просто назвать конкретный дистрибутив.
Свойства распределений
Благодаря повторному применению мы привыкли думать о «свойстве» распределения как о некоторой понятной величине, которая часто появляется в нашей работе, такой как ее ожидание, дисперсия и так далее. Проблема с этим в качестве возможного определения «свойства» заключается в том, что оно слишком расплывчато и недостаточно обобщенно. (Именно здесь математика была в середине 18-го века, где «функции» рассматривались как конечные процессы, применяемые к объектам.) Вместо этого, единственное разумное определение «свойства», которое всегда будет работать, - думать о свойстве как о будучи числом, которое однозначно присваивается каждому распределению в Ω, Это включает в себя среднее значение, дисперсию, любой момент, любую алгебраическую комбинацию моментов, любой квантиль и многое другое, включая вещи, которые даже не могут быть вычислены. Однако, это не включает то , что не имело бы никакого смысла для некоторых из элементов . Например, если Ω состоит из всех распределений Стьюдента t, то среднее значение не является допустимым свойством для Ω (поскольку t 1 не имеет среднего значения). Это еще раз впечатляет нас, насколько наши идеи зависят от того, из чего действительно состоит Ω .ΩΩΩT1Ω
Свойства не всегда параметры
Свойство может быть настолько сложной функцией, что оно не будет служить параметром. Рассмотрим случай «нормального распределения». Возможно, мы захотим узнать, является ли среднее истинного распределения при округлении до ближайшего целого числа четным. Это собственность. Но это не будет служить параметром.
Параметры не обязательно являются свойствами
Когда параметры и распределения находятся в взаимно-однозначном соответствии, тогда, очевидно, любой параметр и любая функция параметров в этом отношении является свойством согласно нашему определению. Но не должно быть однозначного соответствия между параметрами и распределениями: иногда несколько распределений должны описываться двумя или более четко различающимися значениями параметров. Например, параметр местоположения для точек на сфере, естественно, будет использовать широту и долготу. Это нормально - за исключением двух полюсов, которые соответствуют заданной широте и любой действительной долготе. место(точка на сфере) действительно является свойством, но его долгота не обязательно является свойством. Хотя существуют различные уклоны (например, просто объявляется, что долгота полюса равна нулю), эта проблема подчеркивает важное концептуальное различие между свойством (которое уникально связано с распределением) и параметром (который является способом маркировки распределение и не может быть уникальным).
Статистические процедуры
Цель оценки называется оценкой . Это просто собственность. Статистик не может выбрать оценку: это область ее клиента. Когда кто-то приходит к вам с выборкой из популяции и просит вас оценить 99-й процентиль популяции, вы, скорее всего, упустите возможность дать оценку среднего значения вместо этого! Ваша задача как статистика состоит в том, чтобы определить хорошую процедуру для оценки оценки, которую вам дали. (Иногда ваша работа состоит в том, чтобы убедить вашего клиента, что он выбрал неправильную оценку для своих научных целей, но это другая проблема ...)
По определению, процедура - это способ получить число из данных. Процедуры обычно задаются в виде формул, которые должны применяться к данным, например, «сложить их все и разделить на их количество». Буквально любая процедура может быть объявлена «оценщиком» данной оценки. Например, я мог бы заявить, что выборочное среднее (формула, примененная к данным) оценивает дисперсию совокупности (свойство совокупности, предполагая , что наш клиент ограничил набор возможных совокупностей чтобы включить только те, которые фактически имеют отклонения).Ω
Оценщики
Оценщик не должен иметь никакой очевидной связи с оценкой. Например, вы видите какую-либо связь между выборочным средним и популяционной дисперсией? Я тоже. Но, тем не менее, выборочное среднее фактически является приличной оценкой дисперсии населенностей для некоторого Ω (например, множества всех распределений Пуассона). В этом заключается один из ключей к пониманию оценок: их качества зависят от множества возможных состояний . Но это только часть этого.Ω
Компетентный статистик захочет узнать, насколько хорошо будет выполнять рекомендованная ими процедура. Давайте назовем процедуру " " и пусть оценочная величина будет θ . Не зная, какое распределение на самом деле является истинным, она будет рассматривать выполнение процедуры для каждого возможного распределения F ∈ Ω . При наличии такой F и любых возможных результатов s (то есть набора данных) она будет сравнивать t ( s ).Tθ F∈ ΩFsт ( с ) (что оценивает ее процедура) с (значением оценки для F ). θ ( F)FЭто ее клиент обязан сказать ей, насколько близко или далеко друг от друга эти двое. (Это часто делается с помощью функции «потери».) Затем она может рассмотреть ожидание расстояния между и θ ( F ) . Это риск ее процедуры. Поскольку это зависит от F , риск является функцией, определенной на Ω .т ( с )θ ( F)FΩ
(Хорошо) статистики рекомендуют процедуры, основанные на сравнении рисков. Например, предположим, что для каждого риск процедуры tF∈ Ω меньше или равен риску t . Тогда нет никакой причины использовать t : это «недопустимо». В противном случае это «допустимо».T1TT
(«Байесовский» статистик всегда будет сравнивать риски путем усреднения по «предшествующему» распределению возможных состояний (обычно предоставляется клиентом). «Частый» статистик может сделать это, если такой предварительный случай оправданно существует, но он также готов сравнить риски другими способами, избегая байесовских.)
Выводы
Мы имеем право сказать , что любой , что является допустимым для & thetas является оценка из & thetas . Tθθ Мы должны в практических целях (поскольку допустимые процедуры найти сложно) согнуть это, говоря, что любой T который имеет приемлемо небольшой риск (по сравнению с ) среди практически осуществимых процедур, является оценкой θ . θθ «Приемлемо» и «практически осуществимо» определяются клиентом, конечно: «приемлемо» относится к их риску, а «практически осуществимо» отражает стоимость (в конечном итоге оплачиваемую ими) реализации процедуры.
В основе этого краткого определения лежат все только что обсужденные идеи: чтобы понять его, мы должны иметь в виду конкретное (которое являетсяΩ моделью исследуемой проблемы, процесса или совокупности), определенную оценку (предоставленную клиентом), специфическая функция потерь (которая количественно связывает с оценкой и также дается клиентом), идея риска (вычисляется статистиком), некоторая процедура для сравнения функций риска (ответственность статистика по согласованию с клиентом), и понимание того, какие процедуры на самом деле могут быть выполнены (проблема «практичности»), даже если ни одно из них явно не упомянуто в определении.T
Как и во многих вопросах об определениях, ответы должны иметь представление как об основополагающих принципах, так и о том, как термины используются на практике, которые часто могут быть, по крайней мере, немного беспорядочными или непоследовательными, даже у людей, которые хорошо информированы, и более важно, переменная от сообщества к сообществу.
Один общий принцип заключается в том, что статистика - это свойство выборки и известной константы, а параметр - это соответствующее свойство совокупности, а значит, и неизвестной константы. Слово «соответствующий» здесь следует понимать как достаточно эластичное. Между прочим, именно этому различию и именно этой терминологии меньше чем столетие, введенное Р. А. Фишером.
Но
Структура выборки и популяции не характеризует все наши собственные проблемы. Временные ряды являются одним из основных классов примеров, в которых идея является скорее базовым процессом генерации, и что-то подобное, возможно, является более глубокой и более общей идеей.
Существуют настройки, в которых параметры меняются. Опять же, анализ временных рядов дает примеры.
К главному пункту здесь, мы на практике не рассматриваем все свойства популяции или процесса как параметры. Если какая-то процедура предполагает модель нормального распределения, то минимум и максимум не являются параметрами. (Действительно, согласно модели, минимум и максимум - это произвольно большие отрицательные и положительные числа в любом случае, не то, чтобы это нас беспокоило.)
Я бы сказал, что на этот раз Википедия указывает правильное направление, и практика и принцип соблюдаются, если мы говорим, что параметр - это то, что мы оцениваем .
Это также помогает с другими вопросами, которые вызвали недоумение. Например, если мы вычислим усеченное на 25% среднее, что мы оцениваем? Разумным ответом является соответствующее свойство населения, которое в действительности определяется методом оценки. Одна из терминологий заключается в том, что оценщик имеет оценку независимо от того, что он оценивает. Начиная с какой-то платонической идеи свойства "там" (скажем, способа распределения) и размышляя о том, как оценить это разумно, а также придумывая хорошие рецепты для анализа данных и обдумывая, что они подразумевают, когда их рассматривают как вывод.
Как это часто бывает в прикладной математике или естествознании, у параметра есть два аспекта. Мы часто думаем об этом как о чем-то реальном, что мы открываем, но также верно и то, что это нечто, определенное нашей моделью процесса, так что оно не имеет значения вне контекста модели.
Два совершенно разных момента:
Многие ученые используют слово «параметр» так же, как статистики используют переменные. У меня есть как ученый, так и статистик, и я бы сказал, что это неудачно. Переменные и свойства - лучшие слова.
В более широком использовании английского языка замечательно, что параметр, как полагают, означает пределы или границы, которые могут проистекать из некоторой оригинальной путаницы между «параметром» и «периметром».
Записка по поводу точки зрения
Классическая позиция заключается в том, что мы заранее определяем параметр, а затем решаем, как его оценить, и это остается практикой большинства, но изменение процесса не абсурдно и может помочь при некоторых проблемах. Я называю это оценочной точкой зрения. Это было в литературе не менее 50 лет. Тьюки (1962, стр. 60) убеждал, что
«Мы должны уделять еще больше внимания тому, чтобы начать с оценки и выяснить, что является разумной оценкой, чтобы выяснить, что разумно считать оценщиком оценкой».
Подобная точка зрения была формально разработана в значительной детализации и глубине Биккелем и Леманом (1975) и неофициально со значительной ясностью Мостеллером и Тьюки (1977, с. 32-34).
Существует также элементарная версия. Использование (скажем) выборочного медианного или геометрического среднего для оценки соответствующего параметра совокупности имеет смысл независимо от того, является ли базовое распределение симметричным, и тот же гудвилл может быть распространен на (например) выборочные средние значения, которые рассматриваются как оценки их аналогов по совокупности ,
Бикель, П.Дж. и Э.Леманн. 1975. Описательная статистика для непараметрических моделей. II. Местоположение . Летопись статистики 3: 1045-1069.
Мостеллер, Ф. и Дж. В. Тьюки. 1977. Анализ данных и регрессия. Чтение, Массачусетс: Аддисон-Уэсли.
Тьюки, JW 1962. Будущее анализа данных . Анналы математической статистики 33: 1-67.
источник
(Все это, конечно, предполагает, что моя модель распределения населения или процесса генерирования данных верна. Как всегда, стоит помнить, что «все модели ошибочны, но некоторые полезны» - Джордж Бокс .)
Чтобы ответить на ваши вопросы более четко, я бы сказал:
источник
На этот вопрос было несколько хороших ответов, я просто подумал, что суммирую интересную ссылку, которая обеспечивает довольно строгое обсуждение оценок.
Страница виртуальных лабораторий по оценкам определяет
Понятие функции распределения является очень общей идеей. Таким образом, каждый приведенный выше пример можно рассматривать как функцию определенного распределения.
источник