Мы, как правило, знакомимся с методом оценки моментов, «приравнивая моменты совокупности к их выборочному аналогу», пока не оценим все параметры совокупности; так что в случае нормального распределения нам понадобятся только первый и второй моменты, потому что они полностью описывают это распределение.
И мы можем теоретически вычислить до дополнительных моментов как:
Как я могу построить интуицию для того, что на самом деле моменты? Я знаю, что они существуют как понятия в физике и в математике, но я не нахожу ни одно из них, особенно потому, что не знаю, как сделать абстракцию от концепции массы до точки данных. Термин, кажется, используется в статистике особым образом, который отличается от использования в других дисциплинах.
Какая характеристика моих данных определяет, сколько ( ) моментов существует в целом?
Ответы:
Прошло много времени с тех пор, как я посещал урок физики, поэтому дайте мне знать, если что-то из этого неверно.
Общее описание моментов с физическими аналогами
Возьмите случайную переменную, . П -й момент X вокруг с составляет: м п ( с ) = Е [ ( X - с ) п ] Это в точности соответствует физическому смыслу мгновения. Представьте X как набор точек вдоль реальной линии с плотностью, заданной в PDF. Поместите точку опоры под этой линией в точке c и начните вычислять моменты относительно этой точки, и вычисления будут точно соответствовать статистическим моментам.Икс N Икс с
Большая часть времени, то -го момент X относится к моменту вокруг 0 (моментов , когда точка опоры находится в точке 0): м п = E [ X п ] п -го центральный момент X является: м п = m n ( m 1 ) = E [ ( X - m 1 ) n ]N Икс
-го стандартизированы момент X является: ~ т п = т пN Икс
Обычно используемые моменты
Для любого распределения существует потенциально бесконечное количество моментов. Достаточные моменты почти всегда будут полностью характеризовать и распределять (получение необходимых условий для того, чтобы быть уверенным, является частью проблемы моментов ). В статистике часто говорят о четырех моментах:
Мы редко говорим о моментах, не связанных с куртозом, именно потому, что у них очень мало интуиции. Это похоже на остановку физиков после второго момента.
источник
Это немного старая тема, но я хотел бы исправить искажение в комментарии Фг Ну, который написал: «Моменты параметризованы натуральными числами и полностью характеризуют распределение».
Моменты НЕ полностью характеризуют распределение. В частности, знание всего бесконечного числа моментов, даже если они существуют, не обязательно однозначно определяет распределение.
Согласно моей любимой книге по вероятности, Феллер «Введение в теорию вероятностей и ее приложения, том II» (см. Мой ответ на реальных примерах общих распределений ), раздел VII.3, пример на стр. 227-228, логнормальное не определено его моментами, что означает, что существуют другие распределения, имеющие все бесконечное число моментов, такие же, как у логнормального, но разные функции распределения. Как широко известно, функция генерирования моментов не существует для логнормального значения, как и для других распределений, обладающих такими же моментами.
Как указано на с. 228, по существу ненулевая случайная величинаИкс определяется его моментами, если они все существуют и
расходится. Обратите внимание, что это не тогда и только тогда. Это условие не выполняется для Логнормального и действительно не определяется его моментами.
С другой стороны, распределения (случайные величины), которые разделяют все бесконечное число моментов, могут сильно отличаться только из-за неравенств, которые могут быть получены из их моментов.
источник
Следствие замечаний Глен_б состоит в том, что первый момент, среднее значение, соответствует центру тяжести физического объекта, а второй момент вокруг среднего, дисперсия, соответствует моменту его инерции. После этого ты сам по себе.
источник
Биномиальное дерево имеет две ветви, каждая с вероятностью 0,5. На самом деле р = 0,5, а q = 1-0,5 = 0,5. Это создает нормальное распределение с равномерно распределенной вероятностной массой.
На самом деле, мы должны предположить, что каждый уровень в дереве завершен. Когда мы разбиваем данные на бункеры, мы получаем реальное число от деления, но мы округляем. Ну, это уровень, который не является полным, поэтому мы не получаем гистограмму, приближающуюся к нормали.
Измените вероятности ветвления на p = 0,9999 и q = 0,0001, и это приведет нас к искаженной норме. Масса вероятности сместилась. Это объясняет асимметрию.
Наличие неполных ярусов или бинов меньше 2 ^ n порождает биномиальные деревья с областями, которые не имеют вероятностной массы. Это дает нам эксцесс.
Ответ на комментарий:
Когда я говорил об определении количества бинов, округлим до следующего целого числа.
Машины Quincunx сбрасывают шары, которые в конечном итоге приближаются к нормальному распределению через бином. Такая машина делает несколько предположений: 1) число бинов конечно, 2) базовое дерево двоично и 3) вероятности фиксированы. Машина Quincunx в Музее математики в Нью-Йорке позволяет пользователю динамически изменять вероятности. Вероятности могут измениться в любое время, даже до завершения текущего слоя. Отсюда и идея о том, что контейнеры не заполнены.
В отличие от того, что я сказал в своем первоначальном ответе, когда у вас есть пустота в дереве, распределение демонстрирует эксцесс.
Я смотрю на это с точки зрения генеративных систем. Я использую треугольник, чтобы суммировать деревья решений. Когда новое решение принято, добавляется больше корзин в основании треугольника, а с точки зрения распределения - в хвостах. Обрезка поддеревьев из дерева оставит пустоты в массе вероятности распределения.
Я только ответил, чтобы дать вам интуитивное чувство. Этикетки? Я использовал Excel и поиграл с вероятностями в бином, и сгенерировал ожидаемые перекосы. Я не сделал этого с куртозом, это не помогает, что мы вынуждены думать о вероятностной массе как о статичной, используя язык, предлагающий движение. Основные данные или шары вызывают куртоз. Затем мы анализируем его по-разному и приписываем ему в форме описательных терминов, таких как центр, плечо и хвост. Единственное, с чем мы должны работать - это мусорные ведра. Бункеры живут динамической жизнью, даже если данные не могут.
источник