Вопросы с тегом «non-independent»

Данные, события, процессы и т. Д. Не являются независимыми, если знание одного предоставляет некоторую информацию о состоянии или значении другого.

54
О важности предположения IID в статистическом обучении

В статистическом обучении, неявно или явно, всегда предполагается, что обучающий набор состоит из наборов ввода / ответа , которые независимо взяты из одного и того же совместного распределения сD ={ X , y }D={X,y}\mathcal{D} = \{ \bf {X}, \bf{y} \}NNNP ( X , y )( Xя, уя)(Xi,yi)({\bf{X}}_i,y_i)...

37
Как мне проверить нелинейную связь?

Для графика 1 я могу проверить связь между x и y, выполнив простую корреляцию. Для графика 2, где взаимосвязь нелинейная, но существует четкая связь между x и y, как я могу проверить связь и обозначить ее природу?...

36
Значение «положительной зависимости» как условия использования обычного метода контроля FDR

Бенджамини и Хохберг разработали первый (и, я думаю, до сих пор наиболее широко используемый) метод контроля частоты ложных обнаружений (FDR). Я хочу начать с набора значений P, каждое для отдельного сравнения, и решить, какие из них являются достаточно низкими, чтобы их можно было назвать...

27
Корреляция эквивалентна ассоциации?

Мой профессор статистики утверждает, что слово «корреляция» применяется строго к линейным отношениям между переменными, тогда как слово «ассоциация» широко применяется к любому типу отношений. Другими словами, он утверждает, что термин «нелинейная корреляция» является оксюмороном. Из того, что я...

23
Свойства PCA для зависимых наблюдений

Обычно мы используем PCA как метод уменьшения размерности для данных, где предполагается, что случаи Вопрос: Каковы типичные нюансы в применении PCA для зависимых, неидеальных данных? Какие полезные / полезные свойства PCA для данных iid скомпрометированы (или полностью потеряны)? Например, данные...

18
Что означает «зависимый» и «независимый» тесты в литературе по множественным сравнениям?

В литературе как по частоте появления ошибок (FWER), так и по частоте ложных обнаружений (FDR) конкретные методы контроля FWER или FDR считаются подходящими для зависимых или независимых тестов. Например, в статье 1979 года «Простая последовательная объективная процедура множественных испытаний»...

14
Линейное моделирование смешанных эффектов с данными двойниковых исследований

Предположим, у меня есть некоторая переменная ответа которая была измерена от го брата в м семействе. Кроме того, некоторые поведенческие данные были собраны в то же время от каждого субъекта. Я пытаюсь проанализировать ситуацию с помощью следующей линейной модели смешанных эффектов: j i x i...

14
Почему модели со смешанными эффектами разрешают зависимость?

Скажем, нас интересует, как на экзаменационные оценки учеников влияет количество часов, которые они изучают. Чтобы исследовать это соотношение, мы могли бы запустить следующую линейную регрессию: exam.gradesi=a+β1×hours.studiedi+eiexam.gradesi=a+β1×hours.studiedi+ei \text{exam.grades}_i = a +...

14
Для интуиции, каковы некоторые реальные примеры некоррелированных, но зависимых случайных величин?

Объясняя, почему некоррелированные не подразумевают независимость, есть несколько примеров, которые включают в себя группу случайных величин, но все они кажутся такими абстрактными: 1 2 3 4 . Этот ответ, кажется, имеет смысл. Моя интерпретация: случайная величина и ее квадрат могут быть...

13
Что такое долгосрочная дисперсия?

Как определяется долгосрочная дисперсия в области анализа временных рядов? Я понимаю, что это используется в том случае, если в данных есть корреляционная структура. Таким образом, наш стохастический процесс не будет семейством случайными переменными, а будет только идентично...

12
В чем разница между линейно зависимой и линейно коррелированной?

Пожалуйста, объясните, в чем разница, если две переменные линейно зависимы или линейно коррелированы . Я посмотрел статью в Википедии, но не нашел подходящего примера. Пожалуйста, объясните это на...

12
Как выполнить вменение значений в очень большом количестве точек данных?

У меня очень большой набор данных и около 5% случайных значений отсутствуют. Эти переменные связаны друг с другом. В следующем примере набор данных R - просто игрушечный пример с фиктивными коррелированными данными. set.seed(123) # matrix of X variable xmat <- matrix(sample(-1:1, 2000000,...

11
Насколько проблематично контролировать несуществующие ковариаты в наблюдательном (т.е. нерандомизированном) исследовании?

Миллер и Чепмен (2001) утверждают, что абсолютно неуместно контролировать несуществующие ковариаты, которые связаны как с независимыми, так и с зависимыми переменными в наблюдательном (нерандомизированном) исследовании, хотя это обычно делается в социальных науках. Насколько проблематично это...

9
Какая модель глубокого обучения может классифицировать категории, которые не являются взаимоисключающими

Примеры: у меня есть предложение в должностной инструкции: «Старший инженер Java в Великобритании». Я хочу использовать модель глубокого обучения, чтобы предсказать ее как 2 категории: English и IT jobs. Если я использую традиционную классификационную модель, она может предсказать только 1 метку с...

9
Почему корреляция остатков не имеет значения при тестировании на нормальность?

Когда (то есть Y происходит из модели линейной регрессии), ε ∼ N ( 0 , σ 2 I )Y= A X+ εY=AX+εY = AX + \varepsilonYYY И в этом случае невязок е 1 , ... , е п коррелируют и ненезависимыми. Но когда мы делаем регрессионную диагностику и хотим проверить предположение , е ~ N ( 0 , σ 2 I ) , каждый...

9
Как смоделировать сумму случайных величин Бернулли для зависимых данных?

У меня есть почти такие же вопросы, как этот: Как я могу эффективно моделировать сумму случайных величин Бернулли? Но настройка совсем другая: P ( X i = 1 ) = p i N p iS= ∑я = 1 , NИксяSзнак равноΣязнак равно1,NИксяS=\sum_{i=1,N}{X_i} , , ~ 20, ~ 0,1п( Хя= 1 ) = ряп(Иксязнак равно1)знак...

9
Рассчитать кривую ROC для данных

Итак, у меня есть 16 испытаний, в которых я пытаюсь идентифицировать человека по биометрической характеристике, используя расстояние Хэмминга. Мой порог установлен на 3,5. Мои данные ниже, и только пробная версия 1 является истинным положительным результатом: Trial Hamming Distance 1 0.34 2 0.37 3...