Отказ от ответственности: если вы обнаружите, что этот вопрос слишком похож на другой, я рад его объединению. Тем не менее, я не нашел удовлетворительного ответа где-либо еще (и у меня пока нет «репутации», чтобы комментировать или поднимать голос), поэтому я подумал, что было бы лучше задать новый вопрос самостоятельно.
У меня вопрос такой. Для каждого из 12 человеческих субъектов я вычислил коэффициент корреляции (число Спирмена) между 6 уровнями независимой переменной X и соответствующими наблюдениями зависимой переменной Y. (Примечание: уровни X не равны между субъектами.) Мой нулевая гипотеза состоит в том, что в общей популяции эта корреляция равна нулю. Я проверил эту гипотезу двумя способами:
Использование t-критерия с одной выборкой для коэффициентов корреляции, полученных от моих 12 предметов.
Центрируя мои уровни X и наблюдения Y так, чтобы для каждого участника среднее (X) = 0 и среднее (Y) = 0, а затем вычисляя корреляцию по совокупным данным (72 уровня X и 72 наблюдения Y) ,
Теперь, читая о работе с коэффициентами корреляции (здесь и в других местах), я начал сомневаться в правильности первого подхода. В частности, я видел следующее уравнение, всплывающее в нескольких местах, представленное (по-видимому) как t-критерий для средних коэффициентов корреляции:
где будет средним коэффициентом корреляции (и давайте предположим, что мы получили его, используя сначала преобразование Фишера по коэффициентам для каждого субъекта), а - количество наблюдений. Интуитивно, это кажется мне неправильным, поскольку оно не включает какую-либо меру изменчивости между субъектами. Другими словами, если бы у меня было 3 коэффициента корреляции, я бы получил одну и ту же t-статистику, независимо от того, были ли они [0,1, 0,5, 0,9] или [0,45 0,5 0,55], или любой диапазон значений с одинаковым средним (и )n n = 3
Поэтому я подозреваю, что вышеприведенное уравнение фактически не применяется при проверке значимости среднего коэффициента корреляции, но при проверке значимости одного коэффициента корреляции на основе наблюдений двух переменных.
Может ли кто-нибудь здесь подтвердить эту интуицию или объяснить, почему она не так? Кроме того, если эта формула не применима к моему случаю, кто-нибудь знает / правильный подход? Или, может быть, мой собственный тест № 2 уже действителен? Любая помощь очень ценится (включая указатели на предыдущие ответы, которые я, возможно, пропустил или неправильно истолковал).
источник
Ответы:
Лучшим подходом к анализу этих данных является использование смешанной модели (она же модель смешанных эффектов, иерархическая модель) со
subject
случайным эффектом (случайный перехват или случайный перехват + наклон). Подводя итог другого моего ответа :По сути, это регрессия, которая моделирует единые общие отношения, позволяя этим отношениям различаться между группами (субъектами). Этот подход выигрывает от частичного объединения и использует ваши данные более эффективно.
источник
Я предполагаю, что переменных ( 6 X и 6 Y ) одинаковы для всех людей (на самом деле я не уверен, что понимаю, что вы имеете в виду, говоря, что уровни не одинаковы для разных предметов: я надеюсь, что вы имеется в виду независимость между диапазонами переменных, а не то, какие переменные измеряются для каждого человека). Да, формула, которую вы показали, относится к коэффициенту корреляции между двумя переменными.12 6 X 6 Y
В своем пункте 2 вы говорите о нормализации: я думаю, что это имело бы смысл, если бы вы делали это для каждой из переменных в отдельности. Однако, несмотря на это, проблема этого подхода заключается в том, что он не контролирует внутри-индивидуальную зависимость.6∗2
Я полагаю, что ваш подход 1 также недопустим, потому что это будет тест из переменных с распределением t только с 10 степенями свободы, поэтому я не думаю, что вы можете применить Центральную предельную теорему в этом случае.6 t 10
Возможно, с большими числами вы могли бы использовать подход со случайным эффектом, учитывающий случайный наклон и одновременно проверяющий как нулевой средний коэффициент (от по Y i ), так и отсутствие случайного коэффициента. Однако я считаю, что для этого недостаточно 6 переменных и 12 наблюдений.Xi Yi
Я предлагаю вам посмотреть на это как на тест 6 значений (становясь 12, если вы также учитываете значения ниже диагонали) матрицы корреляции среди переменных (как X, так и Y ), то есть тех, которые находятся на диагонали 2-го (и эквивалентно 3-му) квадранту. Таким образом, я бы сделал тест отношения правдоподобия между ограниченной и неограниченной моделью.12 X Y
@Alexis Я понимаю, что центрирование , Y 1 , ... , Y 6 , заменив их на X * 1 = X 1 - ¯ X 1 , ... , X * 6 = X 6 - ¯ X 6 , Y ∗ 1 = Y 1 - ¯ Y 1 , … , Y ∗X1,…,X6 Y1,…,Y6 будет иметь смысл (я думаючтотакже имеет смысл разделить их на ихSE«s). Таким образом, переменныеX∗иY∗(созданные с учетомX ∗ i ,1≤i≤6,как если бы они были вхождениями единственной переменной, и то же самое дляY ∗ i ) имели бы все0. Напротив, если мысначалапостроим две переменныеX,Y(созданные с учетомXX∗1=X1−X1¯,…,X∗6=X6−X6¯,Y∗1=Y1−Y1¯,…,Y∗6=Y6−Y6¯ SE X∗ Y∗ X∗i,1≤i≤6 Y*я 0 Икс, Y как если бы они были вхождениями уникальной переменной, и то же самое для Y i ), то, конечно, вычитание среднего значения (а также деление на SE X и Y ) ничего не изменит.Икся, 1 ≤ i ≤ 6 Yя Икс Y
РЕДАКТИРОВАТЬ 01/01/18
Позвольте указать переменную и j ( 1 ≤ j ≤ 12 ) человека. Тогда предположим, что у нас есть:я J 1 ≤ j ≤ 12
;Икс1 J= Y1 J= 10 , ∀ j
;Икс2 Дж= Y2 Дж= 8 , ∀ j
;Икс3 Дж= Y3 Дж= 6 , ∀ j
;Икс4 Дж= Y4 Дж= 4 , ∀ j
;Икс5 Дж= Y5 Дж= 2 , ∀ j
.Икс6 Дж= - Y6 Дж= j , ∀ j
Корреляция в этом случае должна быть .0,5428
Если мы центрируем каждую переменную, учитывая, что для и X i, и Y i не имеют вариаций, мы имеем: X ∗ i j = Y ∗ i j = 0 . Что касается i = 6 , мы получаем значения X ∗ 6 j = j - 6,5 , Y ∗ j 6 = ( 13 - j ) - 6,5 = 6,5 -1≤i≤5 Xi Yi X∗ij=Y∗ij=0 i=6 (т. е. для X : - 5,5 , - 4,5 , - 3,5 , - 2,5 , - 1,5 , - 0,5 , 0,5 , 1,5 , 2,5 , 3,5 , 4,5 , 5,5 , и с точностью до Y ) , Поскольку 0 = - 0 и j - 6,5 = - ( 6,5 - j ) , мы получаем: X ∗X∗6j=j−6.5,Y∗j6=(13−j)−6.5=6.5−j X −5.5,−4.5,−3.5,−2.5,−1.5,−0.5,0.5,1.5,2.5,3.5,4.5,5.5 Y 0=−0 j−6.5=−(6.5−j) , что подразумевает корреляцию-1.X∗ij=−Y∗ij∀i,j→X∗=−Y∗ −1
источник