Я думал о значении масштаба семьи. Насколько я понимаю, для каждого члена семейства масштабов местоположения с параметрами location и scale распределение не зависит от каких-либо параметров и одинаково для каждого принадлежащего этому семейству.
Итак, мой вопрос: не могли бы вы привести пример, когда два случайных числа из одного семейства распределения стандартизированы, но это не приводит к случайной переменной с одинаковым распределением?
Скажем, и к одному и тому же семейству распределения (где под семейством я имею в виду, например, «Нормальное» или «Гамма» и т. Д.) Определение:
мы знаем, что и и имеют одинаковое ожидание и дисперсию, .
Но могут ли они иметь разные более высокие моменты?
Моя попытка ответить на этот вопрос заключается в том, что если распределение и зависит от более чем 2 параметров, чем могло бы быть. И я думаю о обобщенном который имеет 3 параметра.
Но если число параметров и и принадлежат одному и тому же семейству распределений с одинаковым ожиданием и дисперсией, то означает ли это, что и имеют одинаковое распределение (более высокие моменты)?
Ответы:
Очевидно, существует некоторая путаница относительно того, что такое семейство распределений и как считать свободные параметры в сравнении со свободными плюс фиксированные (назначенные) параметры. Эти вопросы являются сторонними, не связанными с намерением ФП и этого ответа. Я не использую здесь слово « семья», потому что это сбивает с толку. Например, семейство в соответствии с одним источником является результатом изменения параметра формы. @whuber утверждает, что «параметризация» семейства - это непрерывное отображение из подмножества ℝ с его обычной топологией в пространство распределений, образ которого является этим семейством.n Я буду использовать форму слова, которая охватывает как предполагаемое использование слова x 2 -2x+4 a 2 x 2 + a 1 x+ a 0 a 1 =0 a 2 =0идентификация и подсчет семейства и параметров . Например, формулаимеет вид квадратичной формулы, то естьа еслиформула все еще имеет квадратичную форму. Однако, когдаформула является линейной, и форма больше не является достаточно полной, чтобы содержать член квадратичной формы. Тем, кто хочет использовать слово «семья» в надлежащем статистическом контексте, предлагается внести свой вклад в этот отдельный вопрос .x2−2x+4 a2x2+a1x+a0 a1=0 a2=0
Давайте ответим на вопрос «Могут ли они иметь разные более высокие моменты?». Таких примеров много. Попутно отметим, что вопрос, похоже, касается симметричных PDF-файлов, которые, как правило, имеют местоположение и масштаб в простом двухпараметрическом случае. Логика: предположим, что есть две функции плотности с разными формами, имеющие два одинаковых (местоположение, масштаб) параметра. Тогда есть либо параметр формы, который регулирует форму, либо функции плотности не имеют общего параметра формы и, таким образом, являются функциями плотности не общей формы.
Вот пример того, как фигура фигурирует в нем. Обобщенная функция плотности ошибок и здесь , ответ , который , как представляется, свободно выбираемый эксцесс.
Скбкекас - собственная работа, CC BY-SA 3.0, https://commons.wikimedia.org/w/index.php?curid=6057753
PDF (AKA, функция плотности "вероятность", обратите внимание, что слово "вероятность" является лишним) являетсяβ2αΓ(1β)e−(|x−μ|α)β
Среднее значение и местоположение - , масштаб - , а - форма. Обратите внимание, что симметричные PDF-файлы проще представить, поскольку эти PDF-файлы часто имеют местоположение и масштаб в виде простейших двухпараметрических случаев, тогда как асимметричные PDF-файлы, такие как гамма-PDF , обычно имеют форму и масштаб в качестве простейших параметров регистра. Продолжая функцию плотности ошибок, дисперсия , асимметрия равна , а эксцесс -μ α β α 2 Γ ( 3α2Γ(3β)Γ(1β) 0 Γ(5β)Γ(1β)Γ(3β)2−3 αα2=Γ(1, Таким образом, если мы устанавливаем дисперсию равной 1, тогда мы присваиваем значение из при изменении , так что эксцесс выбирается в диапазоне от до .α α2=Γ(1β)Γ(3β) β>0 −0.601114 ∞
То есть, если мы хотим варьировать моменты более высокого порядка, и если мы хотим поддерживать среднее значение ноль и дисперсию 1, нам нужно изменить форму. Это подразумевает три параметра, которые, как правило, представляют собой 1) среднее значение или иным образом соответствующую меру местоположения, 2) шкалу для корректировки отклонения или другого показателя изменчивости и 3) форму. Для этого требуется как минимум три параметра.
Обратите внимание, что если мы сделаем замены , в PDF-файле выше, мы получимβ=2 α=2–√σ e−(x−μ)22σ22π−−√σ,
которая является функцией плотности нормального распределения. Таким образом, обобщенная функция плотности ошибки является обобщением функции плотности нормального распределения. Есть много способов обобщить функцию плотности нормального распределения. Другим примером, но с функцией плотности нормального распределения только в качестве предельного значения, а не со значениями замещения среднего диапазона, такими как обобщенная функция плотности ошибок, является функция плотности Стьюдента . Используя функцию плотности Стьюдента , мы получили бы более ограниченный выбор эксцесса, и является параметром формы, потому что второй момент не существует для . Кроме того, DF−t −t df≥2 df<2 ≥ 1 - t df → ∞на самом деле не ограничивается положительными целочисленными значениями, это в общем случае real . Параметр ученика становится нормальным только в пределе как , поэтому я не выбрал его в качестве примера. Это ни хороший пример, ни контр-пример, и в этом я не согласен с @ Xi'an и @whuber.≥1 −t df→∞
Позвольте мне объяснить это дальше. Можно выбрать две из множества произвольных функций плотности двух параметров, чтобы, например, иметь среднее значение, равное нулю, и дисперсию, равную единице. Однако они не все будут одинаковой формы. Вопрос, однако, касается функций плотности той же формы, а не различных форм. Утверждалось, что функции плотности имеют одинаковую форму, является произвольным назначением, поскольку это вопрос определения, и в этом мое мнение отличается. Я не согласен, что это произвольно, потому что можно либо сделать замену для преобразования одной функции плотности в другую, либо нельзя. В первом случае функции плотности похожи, и если путем подстановки мы можем показать, что функции плотности не эквивалентны, то эти функции плотности имеют различную форму.
Таким образом, используя пример Стьюдента PDF, выбор либо считают , что это является обобщением нормального PDF, в этом случае нормальный PDF имеет допустимую форму для Стьюдента сек PDF», или нет, в этом случае Стьюдента «s PDF имеет другую форму от нормального PDF и , следовательно , не имеет никакого отношения к вопросу , поставленному .−t −t −t
Мы можем утверждать это многими способами. Мое мнение таково , что нормальный PDF является подгруппой выбранной формой Стьюдента «s PDF, но это нормальный PDF не суб-выбор гамма PDF , даже при том , что предельное значение гамма PDF можно показать , быть нормальным PDF, и моя причина этого в том, что в нормальном случае / Student ' поддержка та же, но в нормальном / гамма-случае поддержка бесконечна по сравнению с полубесконечной, что является необходимой несовместимостью ,−t −t
источник
Если вам нужен пример, который является «официально названным параметризованным семейством дистрибутивов, вы можете обратиться к обобщенному гамма-дистрибутиву, https://en.wikipedia.org/wiki/Generalized_gamma_distribution . Это семейство дистрибутивов имеет три параметра, поэтому вы можете зафиксировать среднее и дисперсия и все еще есть возможность варьировать более высокие моменты. На вики-странице алгебра не выглядит привлекательно, я бы предпочел сделать это численно. Для статистических приложений, поиск на этом сайте gamlss, который является расширением gam (обобщенная добавка модели, которые сами по себе являются обобщением glm, которые имеют параметры для «местоположения, масштаба и формы».
Другим примером являются -распределения, расширенные до семейства масштабов местоположения. Тогда третьим параметром будет степень свободы, которая будет определять форму для фиксированного местоположения и масштаба.t
источник
Существует бесконечное число распределений со средним нулем и дисперсией один, поэтому возьмите распределенный из одного из этих распределений, скажем, , и из другого из этих распределений, скажем с 54 степенями свободы масштабируется с помощью так что его дисперсия равна единице, тогда наслаждайтесь свойствами, которые вы упоминаете. «Количество» параметров не имеет значения для свойства.ϵ1 N(0,1) ϵ2 t 13−−√
Очевидно, что если вы установите дополнительные правила для определения этого семейства, например, заявив, что существует фиксированная плотность такая, что плотность равна вас может получиться единственный возможный дистрибутив.f X
источник
Я думаю, вы спрашиваете, могут ли две случайные величины, происходящие из одного и того же семейства масштабов местоположения, иметь одинаковое среднее значение и дисперсию, но, по крайней мере, один другой более высокий момент. Ответ - нет.
Доказательство : пусть и две такие случайные величины. Поскольку и находятся в одном семействе масштабов местоположения, существует случайная величина и действительные числа такие что и . Поскольку и имеют одинаковое среднее значение и дисперсию, мы имеем:X1 X2 X1 X2 X a1>0,a2>0,b1,b2 X1=da1X+b1 X2=da2X+b2 X1 X2
Если , то с вероятностью , и, следовательно, старшие моменты и равны. Таким образом, мы можем предположить, что . Используя это, (2) подразумевает, что, Так как и , фактически мы имеем . В свою очередь, из (1) выше теперь следует, что . Следовательно, имеем: для любого , т. Всех моментов иVar[X]=0 X1=E[X1]=X2=E[X2] 1 X1 X2 Var[X]≠0 |a1|=|a2| a1>0 a2>0 a1=a2 b1=b2
источник
Поскольку вопрос может быть истолкован разными способами, я разделю этот ответ на две части.
Проблема со случаем A может быть легко решена / продемонстрирована многими семействами с параметром формы.
Проблема со случаем B является более сложной, поскольку кажется, что для определения местоположения и масштаба достаточно указать полтора параметра (местоположение в и масштаб в ), и возникает проблема: два параметра могут также использоваться для кодирования (нескольких) форм. Это не так тривиально. Мы можем легко придумать конкретные семейства шкал с двумя параметрами и продемонстрировать, что у вас нет разных форм, но это не доказывает, что это фиксированное правило для любых семейств с двумя параметрами.R R>0
A: Могут ли два разных распределения из одного и того же семейства двухпараметрических распределений иметь одинаковое среднее значение и дисперсию?
Ответ - да, и это уже можно показать, используя один из явно упомянутых примеров: нормализованное гамма-распределение
Семейство нормированных гамма-распределений
Пусть а - гамма-распределенная переменная. (Кумулятивное) распределение является следующим:Z=X−μσ X Z
где - неполная гамма-функция.γ
Таким образом, здесь ясно, что разные и (распределения из семейства нормированных гамма-распределений) могут иметь одинаковое среднее значение и дисперсию (а именно и ), но различаться в зависимости от параметра (часто обозначаемого как параметр 'shape'). Это тесно связано с тем фактом, что семейство гамма-распределений не является семейством масштабов местоположения.Z1 Z2 μ=0 σ=1 k
B: Могут ли два разных распределения из одного и того же семейства распределений масштаба расположения с двумя параметрами иметь одинаковое среднее значение и дисперсию?
Я считаю, что ответ будет отрицательным, если мы рассмотрим только гладкие семейства (гладкие: небольшое изменение параметров приведет к небольшому изменению распределения / функции / кривой). Но этот ответ не так тривиален, и когда мы будем использовать более общие (негладкие) семейства, тогда мы можем сказать « да» , хотя эти семейства существуют только в теории и не имеют практической значимости.
Создание семейства масштабов местоположения из одного распределения путем перевода и масштабирования
Из любого конкретного отдельного дистрибутива мы можем создать семейство масштабов местоположения путем перевода и масштабирования. Если является функцией плотности вероятности одиночного распределения, то функция плотности вероятности для члена семейства будетf(x)
Для семейства масштабов местоположения, которое может быть сгенерировано таким образом, мы имеем:
Могут ли для всех двух семейств параметров масштабирования местоположения их распределения элементов быть сгенерированы из одного распределения элементов путем преобразования и масштабирования?
Таким образом, перевод и масштабирование могут преобразовать один дистрибутив в семейство масштабов местоположения. Вопрос заключается в том, верно ли обратное, и можно ли с помощью перевода и масштабирования описать каждые два параметра семейства масштабов местоположений (где параметры и не обязательно должны совпадать с местоположением и scale ) из одного члена из этой семьи.θ1 θ2 μ σ
Для конкретных двухпараметрических семейств с масштабом местоположения, таких как семейство нормальных распределений, не так уж сложно показать, что они могут быть сгенерированы в соответствии с описанным выше процессом (масштабирование и преобразование одного примера члена).
Можно задаться вопросом, возможно ли, чтобы каждые два параметра семейства масштабов местоположения генерировались из одного члена путем преобразования и масштабирования. Или противоречивое утверждение: «Может ли двухпараметрическое семейство масштабов местоположения содержать два разных распределения членов с одинаковым средним и дисперсией?», Для которого необходимо , чтобы семейство представляло собой объединение нескольких подсемейств, каждое из которых генерируется переводом и масштабирование.
Случай 1: Семейство обобщенных t-распределений Стьюдентов, параметризованных двумя переменными
Придуманный пример возникает, когда мы делаем какое-то отображение из в ( cardinality-of-mathbbr-and-mathbbr2 ), которое позволяет свободно использовать два параметра и для описания объединения нескольких подсемейств, которые генерируется переводом и масштабированием.R2 R3 θ1 θ2
Давайте используем (трехпараметрическое) обобщенное t-распределение Стьюдента:
с тремя параметрами, измененными следующим образом:μσν===tan(θ1)θ2⌊0.5+θ1/π⌋
тогда мы имеем
который можно рассматривать как семейство масштабов с двумя параметрами (хотя и не очень полезное), которое не может быть сгенерировано путем перевода и масштабирования только одного члена.
Случай 2: семейства масштаба местоположения, созданные отрицательным масштабированием одного распределения с ненулевым перекосом
Менее надуманный пример, чем использование этой функции загара, дается Уубер под комментариями ответа Карла. У нас может быть семейство котором изменение знака сохраняет среднее значение и дисперсию неизменными, но, возможно, изменяет неравные более высокие моменты. Таким образом, это немного упрощает семейство шкал с двумя параметрами, где члены с одинаковым средним и дисперсией могут иметь разные моменты более высокого порядка. Этот пример из Whuber можно разделить на два подсемейства, каждое из которых может быть сгенерировано из одного члена путем преобразования и масштабирования.x↦f(x/b+a) b
Гладкие семьи
Если мы попытаемся создать одно гладкое семейство двухпараметрических распределений (гладкое: небольшое изменение параметров приведет к небольшому изменению распределения / функции / кривой), каким-то образом составив композицию из двух или более семейств, которые генерируются в результате преобразования и масштабирование, тогда мы сталкиваемся с проблемами, чтобы два параметра охватывали как изменение «среднего» и «дисперсии», так и третий параметр «форма». Формальное доказательство должно идти тем же путем, что и ответ на вопрос: существует ли гладкая сюръективная функция ?f:R2↦R3 (где ответ отрицательный в случае гладких , т.е. бесконечно дифференцируемых, функций, хотя существуют непрерывные функции, которые будут выполнять работу, такие как кривые Пеано).
Интуиция: представьте, что есть некоторые параметры , которые описывают распределения в некотором семействе распределений в масштабах местоположения и с помощью которых мы можем изменить среднее значение и дисперсию, а также некоторые другие моменты, тогда мы сможем выразить , , в терминах среднего значения и дисперсииθ1 θ2 θ1 θ2 μ σ
но это должны быть многозначные функции, и они не могут выполнять непрерывные переходы; различные значения из для конкретного и не являются непрерывными и не смогут моделировать параметр непрерывной формы.fθ1(μ,σ) μ σ
Я на самом деле не так уверен в этой заключительной части. Мы могли бы использовать кривую заполнения пространства (такую как кривая Пеано, если бы мы только знали, как выразить координаты на кривой в координаты гиперкуба), чтобы один параметр полностью моделировал множество объектов, таких как среднее значение и дисперсия, без отказ от свойства, что небольшое изменение параметра эквивалентно небольшому изменению функции в каждомθ1 θ1 f(x;θ1) x
источник