Надежное многомерное гауссово вписывание в R

11

Мне нужно согласовать обобщенное распределение Гаусса с 7-мерным облаком точек, содержащим довольно значительное число выбросов с высоким кредитным плечом. Вы знаете какой-нибудь хороший пакет R для этой работы?

Къетил б Халворсен
источник
3
Вы найдете ссылки как минимум на четыре пакета R для определения многовариантных выбросов в ответах на аналогичный вопрос по адресу stats.stackexchange.com/questions/213/… . Это может быть хорошим началом.
whuber
Может быть, вопрос ускользает от меня, но если подходить к многомерному распределению Гаусса, почему бы просто не использовать эмпирическое среднее и SD в качестве MLE? Затем вы можете сосредоточиться на диагностической статистике, если есть высокие точки влияния / рычаги.
AdamO

Ответы:

1

Также есть mclust: http://www.stat.washington.edu/research/reports/2012/tr597.pdf http://cran.r-project.org/web/packages/mclust/index.html

Однако одно предостережение: смешанное моделирование в многомерном пространстве может потребовать значительных ресурсов процессора и памяти, если ваше облако точек велико. Около четырех лет назад я делал партию 11-мерных данных с точками 50-200 КБ, и они имели тенденцию загружать 4-11 ГБ ОЗУ и занимать до недели для вычислений для каждого случая (а у меня было 400). Это, конечно, возможно, но может быть головной болью, если вы используете общий вычислительный кластер или имеете ограниченные ресурсы.

Киран О'Нил
источник
1

Это звучит как классическая многомерная модель гауссовой смеси. Я думаю, что пакет BayesM может работать.

Вот несколько многомерных пакетов Гауссовой смеси

  • bayesm: cran.r-project.org/web/packages/bayesm/index.html
  • mixtools: www.jstatsoft.org/v32/i06/paper
EngrStudent
источник