Вопросы с тегом «r»

11
Проверка, существенно ли отличаются два коэффициента регрессии (в идеале R)

Если это дублирующий вопрос, пожалуйста, укажите правильный путь, но похожие вопросы, которые я нашел здесь, не были достаточно похожими. Предположим, я оцениваю модельY= α + βИкс+ тыY=α+βX+uY=\alpha + \beta X + u и найдите, что . Однако оказывается, что , и я подозреваю, что , и, в частности, что...

11
Плюсы дистанции Джеффриса Матуситы

Согласно какой-то статье, которую я читаю, расстояние Джеффриса и Матуситы обычно используется. Но я не мог найти много информации об этом, кроме формулы ниже JMD (x, y) =∑(xi−−√2−yi−−√2)2−−−−−−−−−−−−−√2∑(xi2−yi2)22\sqrt[2]{\sum(\sqrt[2]{x_i}-\sqrt[2]{y_i})^2} Это похоже на евклидово расстояние, за...

11
Как справиться с отсутствующими значениями, чтобы подготовить данные для выбора функции с помощью LASSO?

Моя ситуация: небольшой размер выборки: 116 двоичная переменная результата длинный список объясняющих переменных: 44 объясняющие переменные не исходили из головы; их выбор был основан на литературе. В большинстве случаев в выборке и в большинстве переменных отсутствуют значения. Подход к выбору...

11
В чем разница между «нагрузками» и «корреляционными нагрузками» в PCA и PLS?

При анализе основных компонентов (PCA) обычно нужно распределить две нагрузки друг на друга, чтобы исследовать отношения между переменными. В документе, сопровождающем пакет PLS R для выполнения регрессии главных компонентов и регрессии PLS, есть другой график, называемый графиком корреляционных...

11
Функция передачи вмешательства ARIMA - как визуализировать эффект

У меня есть месячные временные ряды с вмешательством, и я хотел бы количественно оценить влияние этого вмешательства на результат. Я понимаю, что серия довольно короткая, и эффект еще не завершен. Данные cds <- structure(c(2580L, 2263L, 3679L, 3461L, 3645L, 3716L, 3955L, 3362L, 2637L, 2524L,...

11
Методы в R или Python для выбора функций в обучении без учителя [закрыто]

Закрыто. Этот вопрос не по теме . В настоящее время он не принимает ответы. Хотите улучшить этот вопрос? Обновите вопрос, чтобы он соответствовал теме перекрестной проверки. Закрыто 2 года назад . Каковы доступные методы / реализации в R / Python для отбрасывания / выбора неважных / важных функций...

11
Статистика теста Дурбина Уотсона

Я применил тест DW к моей регрессионной модели в R, и я получил статистику теста DW 1,78 и значение p 2,2e-16 = 0. Означает ли это, что не существует автокорреляции между невязками, потому что stat близок к 2 с небольшим p-значением, или это означает, что хотя stat близок к 2, p-значение мало, и...

11
Что такое эквивалент lme4 :: lmer трехсторонних повторяющихся мер ANOVA?

Мой вопрос основан на этом ответе, который показал, какая lme4::lmerмодель соответствует двусторонним повторным измерениям ANOVA: require(lme4) set.seed(1234) d <- data.frame( y = rnorm(96), subject = factor(rep(1:12, 4)), a = factor(rep(1:2, each=24)), b = factor(rep(rep(1:2, each=12))), c =...

11
Как выполнить остаточный анализ для бинарных / дихотомических независимых предикторов в линейной регрессии?

Я выполняю множественную линейную регрессию ниже в R, чтобы предсказать доходность управляемого фонда. reg <- lm(formula=RET~GRI+SAT+MBA+AGE+TEN, data=rawdata) Здесь только GRI и MBA являются бинарными / дихотомическими предикторами; остальные предикторы являются непрерывными. Я использую этот...

11
Использование стандартных инструментов машинного обучения для данных с левой цензурой

Я разрабатываю приложение для прогнозирования, цель которого - позволить импортеру прогнозировать спрос на свою продукцию от своей сети дистрибьюторов. Данные о продажах являются довольно хорошим показателем спроса, если имеется достаточный запас для удовлетворения спроса. Однако, когда инвентарь...

11
Почему runif не генерирует один и тот же результат каждый раз?

Почему генераторы случайных чисел, такие как runif()в R, не генерируют один и тот же результат каждый раз? Например: X <- runif(100) X генерирует разные выходы каждый раз. В чем причина создания разных выходов каждый раз? Какие функции у него есть в фоновом режиме, чтобы сделать...

11
Что мой график ACF говорит мне о моих данных?

У меня есть два набора данных: Мой первый набор данных - это стоимость инвестиций (в миллиардах долларов) в зависимости от времени, каждая единица времени составляет один квартал с первого квартала 1947 года. Время распространяется на третий квартал 2002 года. Мой второй набор данных является...

11
Симуляция Монте-Карло в R

Я пытаюсь выполнить следующее упражнение, но на самом деле понятия не имею, как начать это делать. Я нашел код в своей книге, который выглядит так, но это совершенно другое упражнение, и я не знаю, как связать их друг с другом. Как я могу начать имитировать прибытие и как узнать, когда они...

11
Пояснение формулы для медианы, ближайшей к началу N образцов из единичного шара

В Элементах Статистического Изучения введена проблема, чтобы выделить проблемы с k-nn в многомерных пространствах. Есть точек данных, которые равномерно распределены в мерном единичном шаре.NNNpпp Среднее расстояние от начала координат до ближайшей точки данных определяется выражением:...

11
Биномиальный блеск с категориальной переменной с полным успехом

Я использую glmm с биномиальной переменной ответа и категориальным предиктором. Случайный эффект дается вложенным дизайном, используемым для сбора данных. Данные выглядят так: m.gen1$treatment [1] sucrose control protein control no_injection ..... Levels: no_injection control sucrose protein...

11
R - Лассо регрессия - разные лямбда на регрессор

Я хочу сделать следующее: 1) регрессия OLS (без штрафных санкций) для получения бета-коэффициентов ; обозначает переменные, используемые для регрессии. Я делаю этоb∗jbj∗b_{j}^{*}jjj lm.model = lm(y~ 0 + x) betas = coefficients(lm.model) 2) регрессия Лассо с условием штрафования, критериями выбора...

11
Когда коэффициенты, оцениваемые логистической и логит-линейной регрессией, отличаются?

При моделировании непрерывных пропорций (например, пропорционального растительного покрова на съемочных квадратах или доли времени, вовлеченного в деятельность), логистическая регрессия считается неуместной (например, Warton & Hui (2011). Арксинус асинин: анализ пропорций в экологии ). Скорее,...

11
Как мне интерпретировать вывод лавы?

Я пытаюсь использовать подтверждающий факторный анализ (CFA) lavaan. Мне трудно интерпретировать результат, созданный lavaan. У меня есть простая модель - 4 фактора, каждый из которых поддерживается элементами из собранных данных опроса. Коэффициенты соответствуют тому, что измеряется элементами, в...

11
Протестируйте модель GLM, используя нулевые и модельные отклонения

Я построил модель glm в R и протестировал ее с помощью группы тестирования и обучения, поэтому уверен, что она работает хорошо. Результаты от R: Coefficients: Estimate Std. Error t value Pr(>|t|) (Intercept) -2.781e+00 1.677e-02 -165.789 < 2e-16 *** Coeff_A 1.663e-05 5.438e-06 3.059 0.00222...

11
Модель смешанного эффекта с переменной выборки

Я пытаюсь указать формулу для линейной модели смешанного эффекта (с lme4) для моего экспериментального дизайна, но я не уверен, что я делаю это правильно. Дизайн: в основном я измеряю параметр отклика на растениях. У меня 4 уровня лечения и 2 уровня орошения. Растения сгруппированы в 16 участков, в...