В мае 2010 года пользователь из Википедии Mcorazao добавил в статью об асимметрии следующее предложение : «Нулевое значение указывает на то, что значения относительно равномерно распределены по обе стороны от среднего значения, обычно, но не обязательно, подразумевая симметричное распределение». Однако на вики-странице нет реальных примеров дистрибутивов, которые нарушают это правило. Поиск в Google «примерных асимметричных распределений с нулевой асимметрией» также не дает реальных примеров, по крайней мере, в первых 20 результатах.
Используя определение, что перекос вычисляется с помощью и R формула
sum((x-mean(x))^3)/(length(x) * sd(x)^3)
Я могу построить небольшое произвольное распределение, чтобы уменьшить асимметрию. Например, распределение
x = c(1, 3.122, 5, 4, 1.1)
дает перекос . Но это небольшая выборка, причем отклонение от симметрии невелико. Итак, возможно ли построить большее распределение с одним пиком, который является сильно асимметричным, но при этом имеет асимметрию почти нулевую?
источник
Ответы:
Рассмотрим дискретные распределения. Тот, который поддерживается для значений , определяется неотрицательными вероятностями при условии, что (a) они суммируют с 1 и (b) коэффициент асимметрии равен 0 (что эквивалентно третьему центральному моменту, равному нулю). Это оставляет степени свободы (в смысле решения уравнений, а не в статистическом!). Мы можем надеяться найти решения, которые будут одномодальными.x 1 , x 2 , … , x k p 1 , p 2 , … , p k k - 2К Икс1, х2, … , ХК п1, р2, … , РК к - 2
Чтобы упростить поиск примеров, я искал решения, поддерживаемые на небольшом симметричном векторе с уникальным режимом , среднее значение 0 и нулевой асимметрии. Одним из таких решений является .0 ( p 1 , … , p 7 ) = ( 1396 , 3286 , 9586 , 47386 , 8781 , 3930 , 1235 ) / 75600х =(-3,-2,-1,0,1,2,3) 0 ( р1, … , Р7) = ( 1396 , 3286 , 9586 , 47386 , 8781 , 3930 , 1235 ) / 75600
Вы можете видеть, что это асимметрично.
Вот более очевидно асимметричное решение с (которое асимметрично) и :p = ( 1 , 18 , 72 , 13 , 4 ) / 108х =(-3,-1,0,1,2) р = ( 1 , 18 , 72 , 13 , 4 ) / 108
Теперь очевидно, что происходит: поскольку среднее значение равно , отрицательные значения вносят и в третий момент, в то время как положительные значения дают и , точно уравновешивая отрицательные вклады. Мы можем взять симметричное распределение около , такое как с , и немного сдвинуть массу с до , немного массы от до и небольшое количество массы до( - 3 ) 3 = - 27 18 × ( - 1 ) 3 = - 18 4 × 2 3 = 32 13 × 1 3 = 13 0 x = ( - 1 , 0 , 1 ) p = ( 1 , 4 , 1 ) / 6 + 1 + 2 + 1 - 10 ( - 3 )3= - 27 18 × ( - 1 )3= - 18 4 × 23= 32 13 × 13= 13 0 х =(-1,0,1) p=(1,4,1)/6 +1 +2 +1 −1 0 0−3 поддерживая среднее значение и асимметрию , создавая асимметрию. Тот же подход будет работать для поддержания нулевого среднего и нулевой асимметрии непрерывного распределения, делая его асимметричным; если мы не будем слишком агрессивны с массовым перемещением, оно останется унимодальным.0 0
Изменить: непрерывные распределения
Поскольку проблема продолжает возникать, давайте приведем явный пример с непрерывным распределением. У Питера Флома была хорошая идея: взглянуть на смеси нормалей. Смесь двух нормалей не подойдет: когда ее асимметрия исчезнет, она будет симметричной. Следующий простейший случай - это смесь трех нормалей.
Смеси трех нормалей после соответствующего выбора местоположения и масштаба зависят от шести реальных параметров и, следовательно, должны обладать более чем достаточной гибкостью для получения асимметричного решения с нулевой асимметрией. Чтобы найти их, нам нужно знать, как вычислить асимметрии смесей нормалей. Среди них мы будем искать любые унимодальные (возможно, их нет).
Теперь, вообще говоря, (нецентральный) момент стандартного нормального распределения равен нулю, когда нечетно, и в противном случае равен . Когда мы изменяем масштаб этого стандартного нормального распределения на стандартное отклонение , момент умножается на . Когда мы сдвигаем любое распределение на , новый момент может быть выражен через моменты вплоть до включительно rrth r σrthσrμrthr2r/2Γ(1−r2)/π−−√ σ рго σр μ рго р , Момент смеси распределений (то есть их средневзвешенное значение) является таким же средневзвешенным значением отдельных моментов. Наконец, асимметрия равна нулю именно тогда, когда третий центральный момент равен нулю, и это легко вычисляется в терминах первых трех моментов.
Это дает нам алгебраическую атаку на проблему. Одно решение, которое я нашел, - это равная смесь трех нормалей с параметрами равными , и . Его среднее значение равно . Это изображение показывает pdf синим цветом, а pdf дистрибутива переворачивает его среднее значение красным цветом. То, что они отличаются, показывает, что они оба асимметричны. (Режим приблизительно , что не соответствует среднему значению .) Они оба имеют нулевую асимметрию по конструкции .( 0 , 1 ) ( 1 / 2 , 1 ) ( 0 , √( μ , σ) ( 0 , 1 ) ( 1 / 2 , 1 ) (0+1/2+0)/3=1/60,05192161/6( 0 , 127 / 18------√) ≈ ( 0 , 2.65623 ) ( 0 + 1 / 2 + 0 ) / 3 = 1 / 6 0.0519216 1 / 6
Графики показывают, что они унимодальны. (Вы можете проверить, используя исчисление, чтобы найти локальные максимумы.)
источник
Вот один, который я нашел на https://www.qualitydigest.com/inside/quality-insider-article/problems-skewness-and-kurtosis-part-one.html#, который я нахожу хорошим и воспроизведенный в R: обратный заусенец или распределение Дагума с параметрами формы и :с = 18,1484к = 0,0629 с = 18,1484
Он имеет среднее значение 0,5387, стандартное отклонение 0,2907, асимметрию 0,0000 и эксцесс 2,0000. Источник также называет это «распределением слонов»:
Моя репродукция в R была создана с
Как показывают эти выходные данные, для этих значений параметров асимметрия не совсем нулевая или четырехзначная. Вот небольшой оптимизатор для и :сК с
получая
источник
Рассмотрим распределение в положительной половине реальной линии, которое линейно возрастает от 0 до моды, а затем экспоненциально справа от моды, но непрерывно в моде.
Это можно назвать треугольным экспоненциальным распределением (хотя оно часто выглядит как акулий плавник).
Пусть будет местоположением моды, а будет параметром скорости экспоненты.λθ λ
По мере увеличения распределение становится все менее асимметричным. Когда увеличивается за третий момент переходит из положительного в отрицательный:λ θ ≈ 6,15λ θ λ θ ≈ 6.15
Brizzi (2006) называет это семейство распределений распределением «двух граней» и обсуждает эту точку пересечения, где асимметрия третьего момента равна нулю. фон Хиппель (2005) представляет пример, который почти в этой точке пересечения здесь[ 2 ][ 1 ] [ 2 ]
Нить Нормальные распределения с нулевой асимметрией и нулевым избыточным эксцессом? имеет несколько асимметричных примеров, включая небольшой дискретный пример и другой непрерывный унимодальный:
Дискретные унимодальные распределения - или, что то же самое, выборки - с нулевой асимметрией довольно легко построить, большого или малого размера.
Вот пример, который вы можете рассматривать как образец или (путем деления необработанных частот на 3000) как pmf (значения «x» - это значения, принятые, «n» - количество раз, когда это значение встречается в образце. ):
Этот пример построен из 3-точечных распределений:
для различных значений между 3 и 10. Этот параметризованный (по ) 3-точечный «атом» имеет и , что, в свою очередь, означает, что смеси в различных вариантах имеют ноль перекос. (Вы не можете сделать что-то меньшее, чем распределение по трем точкам, которые имеют асимметрию и третий центральный момент ноль. Совокупность простых частей по нескольким точкам, например, они делают аккуратные строительные блоки, из которых могут быть сделаны большие структуры.)c ∑ i n i x i = 0 ∑ i n i x 3 i = 0 cс с ΣяNяИкся= 0 ΣяNяИкс3я= 0 с
Есть множество других подобных «атомов», которые можно построить, но этот пример использует только этот один вид. К некоторой комбинации атомов, таких как эти, добавляется несколько симметрично расположенных значений, чтобы заполнить оставшиеся отверстия и гарантировать унимодальность, не разрушая структуру среднего и третьего момента.
«Перекошенная модель, сочетающая треугольные и экспоненциальные характеристики: двуликое распределение и его статистические свойства»
Австрийский журнал статистики , 35 : 4, с. 455–462
http: //www.stat .tugraz.at / AJS / ausg064 /
«Среднее значение, медиана и перекос: исправление правила учебника»,
журнал «Статистика», том 13, номер 2,
http://ww2.amstat.org/publications/jse/v13n2/ vonhippel.html
источник
Конечно. Попробуй это:
(Вы уже сделали тяжелые вещи!)
источник
curve(0.2*(dnorm(x, 1, .1) + dnorm(x, 3.122, .1) + dnorm(x, 5, .1) + dnorm(x, 4, .1) + dnorm(x, 1.1, .1)), 0,10)
источник
Следующее дискретное распределение является асимметричным и имеет нулевую асимметрию: Prob (-4) = 1/3, Prob (1) = 1/2, Prob (5) = 1/6. Я нашел это в статье Дорика и др., Qual Quant (2009) 43: 481-493; DOI 10.1007 / s11135-007-9128-9
источник