Распределение наблюдательного уровня по расстоянию Махаланобиса

23

Если у меня есть многовариантный нормальный пример iid , и я определяю (что-то вроде расстояния Махаланобиса [в квадрате] от точки выборки до вектора с использованием матрицы для взвешивания), каково распределение (расстояние Махаланобиса до среднее значение с использованием выборочной ковариационной матрицы )?d 2 i ( b , A ) = ( X i - b ) A - 1 ( X i - b ) a AX1,,XnNp(μ,Σ)

di2(б,A)знак равно(Икся-б)'A-1(Икся-б)
aA ˉ X Sdi2(X¯,S)X¯S

Я смотрю на статью, в которой утверждается, что это , но это, очевидно, неправильно: было бы получено для с использованием (неизвестного) среднего вектора совокупности и ковариационная матрица. Когда образцы аналогов подключены, нужно получить распределение Hotelling , или масштабированное распределение , или что-то в этом роде, но не . Я не смог найти точный результат ни в Muirhead (2005) , ни в Anderson (2003) , ни в Mardia, Kent и Bibby (1979, 2003).χp2χp2di2(μ,Σ)T 2F()χп2, По-видимому, эти парни не беспокоились о посторонней диагностике, так как многовариантное нормальное распределение является идеальным и легко получается каждый раз, когда кто-то собирает многомерные данные: - /.

Все может быть сложнее, чем это. Результат распределения Хотеллинга основан на допущении независимости между векторной и матричной частями; такая независимость не имеет для \ бар X и S , но это уже не имеет для X_i и S .T 2Икс¯SИксяS

Stask
источник
В определении вы все еще рассматриваете как случайную переменную или вы теперь рассматриваете его как фиксированный вектор? Включение нижнего индекса предполагает последнее, но это кажется немного странным. dя2Икся
whuber
1
Просто небольшое примечание, но обратите внимание, что является вспомогательным по отношению к и равно фиксированной константе ( должно быть или подобное, я думаю) почти наверняка. Икся-Икс¯μΣяdя2(Икс¯,S)N-п
кардинал
1
@whuber - возможно, чтобы подчеркнуть, что он рассчитывается с использованием наблюдения из выборки, а не нового наблюдения?
jbowman
1
@whuber, примерно в соответствии с тем, что сказал jbowman - чтобы указать, что это статистика уровня наблюдения (в отличие от статистики уровня выборки, например среднего значения выборки).
StasK
1
Распределение является бета, , но я все еще ищу распределение . Распределения не являются независимыми. dя2(Икс¯,S)N/(N-1)2dя2(Икс¯,S)~В(п/2,(N-п-1)/2)dя2(μ,S)dя2

Ответы:

18

Проверьте гауссово моделирование смеси, используя расстояние Махаланобиса ( альтернативная ссылка ). Смотрите страницу № 13, Второй столбец. Авторы также дали некоторые доказательства также для получения распределения. Дистрибутив масштабируется бета. Пожалуйста, дайте мне знать, если это не работает для вас. В противном случае я мог бы проверить любой намек в книге С.С. Вилкса завтра.

vinux
источник
4
Ответ, приведенный в статье: . Благодарность! N(N-1)2dя2(Икс¯,S)~В(п2,N-п-12)
StasK
9

Есть 3 соответствующих дистрибутива. Как уже отмечалось, если используются истинные параметры популяции, распределение распределяется по хи-квадрат с . Это также асимптотическое распределение с оценочными параметрами и большим размером выборки.dезнак равноп

N(d2)(N-1)2~ВеTa(п2,(N-п-1)2),
Икся
(Nd2(N-п)(п(N-1)(N+1))~F(п,N-п)
Джо Салливан
источник
LATЕИкс
Можете ли вы дать ссылку на формулу F?
eyaler
1
одна связанная ссылка, раздел 3 в Hardin, Johanna и David M. Rocke. 2005. «Распределение робастных расстояний». Журнал вычислительной и графической статистики 14 (4): 928–46. DOI: 10.1198 / 106186005X77685.
Иосиф