Вопросы с тегом «r»

10
Почему значения p меняются по значимости при изменении порядка ковариат в модели aov?

У меня есть набор данных 482 наблюдений. data=Populationfull Я собираюсь сделать анализ ассоциации генотипа для 3 SNP. Я пытаюсь построить модель для моего анализа, и я использую AOV (у ~ х, данные = ...). Для одной черты у меня есть несколько фиксированных эффектов и ковариат, которые я включил в...

10
Математические и статистические предпосылки для понимания фильтров частиц?

В настоящее время я пытаюсь понять фильтры частиц и их возможное использование в финансах, и я немного борюсь. Какие математические и статистические предпосылки я должен пересмотреть (исходя из опыта количественного финансирования), чтобы (i) сделать основы фильтров частиц доступными, и (ii) чтобы...

10
Как получить «собственные значения» (проценты объясненной дисперсии) векторов, которые не являются собственными векторами PCA?

Я хотел бы понять, как я могу получить процент дисперсии набора данных не в координатном пространстве, предоставленном PCA, а по отношению к немного другому набору (повернутых) векторов. set.seed(1234) xx <- rnorm(1000) yy <- xx * 0.5 + rnorm(1000, sd = 0.6) vecs <- cbind(xx, yy)...

10
Построение прогнозных значений во временных рядах ARIMA в R

Вероятно, в этом вопросе есть несколько серьезных недоразумений, но это не означает, что вычисления правильны, а скорее мотивируют изучение временных рядов с некоторым вниманием. Пытаясь понять применение временных рядов, кажется, что удаление данных делает прогноз будущих значений...

10
Сравните статистическую значимость разницы между двумя полиномиальными регрессиями в R

Итак, прежде всего, я провел некоторое исследование на этом форуме, и я знаю, что были заданы чрезвычайно похожие вопросы, но на них обычно не отвечали должным образом, или иногда ответ просто не был достаточно подробным, чтобы я мог понять. Итак, на этот раз мой вопрос: у меня есть два набора...

10
Как объяснить беспристрастную оценку непрофессионалу?

Предположим, что является объективной оценкой для . Тогда, конечно, . ; & thetasE[ & thetas ; |thetas]=thetasθ^θ^\hat{\theta}θθ\thetaE[θ^∣θ]=θE[θ^∣θ]=θ\mathbb{E}[\hat{\theta} \mid \theta] = \theta Как можно объяснить это непрофессионалу? В прошлом я говорил, что если вы усредняете набор...

10
Репликация результатов для линейной регрессии glmnet с использованием универсального оптимизатора

Как говорится в заголовке, я пытаюсь воспроизвести результаты из glmnet linear, используя оптимизатор LBFGS из библиотеки lbfgs. Этот оптимизатор позволяет нам добавлять член регуляризатора L1, не беспокоясь о дифференцируемости, если наша целевая функция (без члена регуляризатора L1) выпуклая....

10
Как сделать перекрестную проверку с помощью cv.glmnet (регрессия LASSO в R)?

Мне интересно, как правильно подойти к обучению и тестированию модели LASSO с использованием glmnet в R? В частности, мне интересно, как это сделать, если отсутствие внешнего набора тестовых данных требует использования перекрестной проверки (или другого аналогичного подхода) для тестирования моей...

10
Почему вы прогнозируете по модели смешанного эффекта, не включая случайные эффекты для прогноза?

Это скорее концептуальный вопрос, но по мере использования Rя буду ссылаться на пакеты в R. Если цель состоит в том, чтобы подогнать линейную модель для целей прогнозирования, а затем делать прогнозы в тех случаях, когда случайные эффекты могут быть недоступны, есть ли польза от использования...

10
K-ближайший сосед с непрерывными и двоичными переменными

У меня есть набор данных с колонками a b c(3 атрибута). aявляется числовым и непрерывным в то время как bи cявляются категориальными каждый с двумя уровнями. Я использую метод K-Nearest Neighbours для классификации aи bдалее c. Таким образом, чтобы иметь возможность измерять расстояния, я...

10
Джеффрис до приёма биномиальной вероятности

Если я использую предварительное значение Джеффриса для параметра биномиальной вероятности то это подразумевает использование распределения .thetas ; ~ б е т ( 1 / 2 , 1 / 2 )θθ\thetaθ∼beta(1/2,1/2)θ∼beta(1/2,1/2)\theta \sim beta(1/2,1/2) Если я перейду на новую систему координат то ясно, что также...

10
Почему я получаю разные прогнозы для ручного полиномиального расширения и использую функцию R `poly`?

Почему я получаю разные прогнозы для ручного полиномиального расширения и использую polyфункцию R ? set.seed(0) x <- rnorm(10) y <- runif(10) plot(x,y,ylim=c(-0.5,1.5)) grid() # xp is a grid variable for ploting xp <- seq(-3,3,by=0.01) x_exp <- data.frame(f1=x,f2=x^2) fit <-...

10
Оцените расхождение Куллбека Лейблера (КЛ) с Монте-Карло

Я хочу оценить KL-расхождение между двумя непрерывными распределениями f и g. Однако я не могу записать плотность ни для f, ни для g. Я могу сделать выборку как из f, так и из g с помощью какого-либо метода (например, цепочки Маркова Монте Карло). Расхождение KL от f до g определяется следующим...

10
Почему стандартная ошибка пропорции, для данного n, наибольшая для 0.5?

Стандартная ошибка пропорции будет наибольшей, которая может быть для данного N, когда рассматриваемая пропорция составляет 0,5, и становится меньше, чем дальше пропорция от 0,5. Я могу понять, почему это так, когда я смотрю на уравнение для стандартной ошибки пропорции, но я не могу объяснить это...

10
Фильтр ARIMA против Калмана - как они связаны

Когда я начал читать о фильтре Калмана, он подумал, что это особый случай модели ARIMA (а именно ARIMA (0,1,1)). Но на самом деле кажется, что ситуация сложнее. Прежде всего, ARIMA можно использовать для прогнозирования, а фильтр Калмана - для фильтрации. Но разве они не тесно связаны? Вопрос:...

10
Добавление предиктора линейной регрессии уменьшает R в квадрате

Мой набор данных ( ) имеет зависимую переменную (DV), пять независимых «базовых» переменных (P1, P2, P3, P4, P5) и одну независимую интересующую переменную (Q).N≈ 10 , 000N≈10,000N \approx 10,000 Я запустил линейные регрессии OLS для следующих двух моделей: DV ~ 1 + P1 + P2 + P3 + P4 + P5 ->...

10
К.Л. Потеря с единицей Гаусса

Я внедрял VAE и заметил в Интернете две разные реализации упрощенной однофакторной гауссовой дивергенции KL. Исходная дивергенция, здесь, выглядит следующим образом: Если мы предположим, что наша единица является т.е. и \ sigma_2 = 1 , это упрощается до KL_ {loss} = - \ log (\ sigma_1) + \ frac {\...

10
Почему тесты гипотез на переделанных наборах данных слишком часто отклоняют нуль?

tl; dr: Начиная с набора данных, сгенерированного под нулевым значением, я повторно проанализировал случаи с заменой и провел проверку гипотезы для каждого повторно выбранного набора данных. Эти проверки гипотез отклоняют ноль более 5% времени. В приведенном ниже очень простом моделировании я...