Вопросы с тегом «r»

13
Как сгенерировать предсказанные кривые выживших из слабых моделей (используя R coxph)?

Я хочу вычислить предсказанную функцию выживания для модели пропорциональных рисков Кокса с ненадежными терминами [используя пакет выживания]. Похоже, что когда в модели присутствуют слабые члены, предсказанная функция выживания не может быть вычислена. ## Example require(survival) data(rats) ##...

13
Работа со связями, весами и голосованием в кНН

Я программирую алгоритм kNN и хотел бы знать следующее: Тай-брейки: Что произойдет, если в голосовании большинства нет явного победителя? Например, все k ближайших соседей принадлежат к разным классам, или для k = 4 есть 2 соседа из класса A и 2 соседа из класса B? Что происходит, если невозможно...

13
Понимание прогнозов из логистической регрессии

Мои прогнозы, основанные на модели логистической регрессии (glm в R), не ограничены между 0 и 1, как я ожидал. Мое понимание логистической регрессии состоит в том, что ваши входные параметры и параметры модели объединяются линейно, и ответ преобразуется в вероятность с помощью функции связи logit....

13
Эффективный размер выборки для последующего вывода из выборки MCMC

При получении образцов MCMC для определения конкретного параметра, каковы хорошие ориентиры для минимального количества эффективных образцов, к которым следует стремиться? И меняется ли этот совет по мере того, как модель становится более или менее...

13
Для случайной матрицы разве SVD не должен вообще ничего объяснять? Что я делаю неправильно?

Если бы я построил двумерную матрицу, состоящую полностью из случайных данных, я ожидал бы, что компоненты PCA и SVD по существу ничего не объясняют. Вместо этого кажется, что первый столбец SVD, кажется, объясняет 75% данных. Как это может быть? Что я делаю неправильно? Вот сюжет: Вот код R:...

13
Термины взаимодействия и полиномы высших порядков

Если бы меня интересовало согласование двусторонних взаимодействий между линейной объясняющей переменной и другой объясняющей переменной b, которая имеет квадратичную связь с зависимой переменной y , мне бы пришлось включить как взаимодействие с квадратичным компонентом, так и взаимодействие с...

13
R-квадрат в линейной модели отклонения стихов в обобщенной линейной модели?

Вот мой контекст для этого вопроса: Из того, что я могу сказать, мы не можем запустить обычную регрессию наименьших квадратов в R при использовании взвешенных данных и surveyпакета. Здесь мы должны использовать svyglm(), который вместо этого запускает обобщенную линейную модель (что может быть тем...

13
Кластер больших данных в R и имеет ли значение выборка?

Я новичок в науке о данных, и у меня проблема с поиском кластеров в наборе данных с 200 000 строк и 50 столбцов в R. Поскольку данные имеют как числовые, так и номинальные переменные, такие методы, как K-средства, которые используют евклидову меру расстояния, не кажутся подходящим выбором. Поэтому...

13
Как вычислить повернутые варимаксом главные компоненты в R?

Я запустил PCA на 25 переменных и выбрал лучшие 7 компьютеров, используя prcomp. prc <- prcomp(pollutions, center=T, scale=T, retx=T) Затем я сделал ротацию варимакса для этих компонентов. varimax7 <- varimax(prc$rotation[,1:7]) А теперь я хочу, чтобы varimax вращал данные, повернутые PCA...

13
Интерполяция данных по гриппу, сохраняющих среднее значение за неделю

редактировать Я нашел статью с описанием именно той процедуры, которая мне нужна. Единственное отличие состоит в том, что документ интерполирует среднемесячные данные на ежедневные, сохраняя при этом среднемесячные значения. У меня есть проблемы, чтобы реализовать подход в R. Любые намеки...

13
Структурные уравнения: как задать эффекты взаимодействия в пакете R lavaan

Я использую R-пакет Lavaan для оценки модели структурного уравнения. Допустим, модель состоит из 1 эндогенной манифестной переменной с 1 скрытой и 2 манифестными объясняющими переменными: group = {0,1} attitude1 = latent,scale age = respondent's age Тогда желаемая модель лавы (не работает): model...

13
Коэффициенты пути - сравнение регрессии гребня, лассо и эластичной сетки

Я хотел бы сравнить модели, выбранные с ребристой, лассо и эластичной сеткой. На рисунке ниже показаны коэффициенты пути, используя все 3 метода: гребень (рис. A, альфа = 0), лассо (рис. B; альфа = 1) и эластичная сетка (рис. C; альфа = 0,5). Оптимальное решение зависит от выбранного значения...

13
Линейная и нелинейная регрессия

У меня есть набор значений и которые теоретически связаны экспоненциально:xxxyyy y=axby=axby = ax^b Одним из способов получения коэффициентов является применение натуральных логарифмов с обеих сторон и подгонка линейной модели: > fit <- lm(log(y)~log(x)) > a <- exp(fit$coefficients[1])...

13
Боксплотный эквивалент для дистрибутивов с тяжелыми хвостами?

Для приблизительно нормально распределенных данных коробочные диаграммы - отличный способ быстро визуализировать медиану и распространение данных, а также присутствие любых выбросов. Однако для распределений с более тяжелыми хвостами многие точки показаны как выбросы, поскольку выбросы определяются...

13
Тест суммы рангов Уилкоксона в R

У меня есть результаты того же теста, примененного к двум независимым образцам: x <- c(17, 12, 13, 16, 9, 19, 21, 12, 18, 17) y <- c(10, 6, 15, 9, 8, 11, 8, 16, 13, 7, 5, 14) И я хочу вычислить критерий суммы рангов Уилкоксона. Когда я вручную вычисляю статистику , я получаю: TWTWT_{W}TW= ∑...

13
Выбор подходящего размера мини-партии для стохастического градиентного спуска (SGD)

Есть ли литература, в которой рассматривается выбор размера мини-партии при выполнении стохастического градиентного спуска? По моему опыту, это, кажется, эмпирический выбор, обычно находящийся в перекрестной проверке или с использованием различных практических правил. Является ли хорошей идеей...

13
Как оценить базовую функцию опасности в модели Кокса с R

Мне нужно оценить базовую функцию риска λ0( т )λ0(T)\lambda_0(t) в зависящей от времени модели Кокса λ ( t ) = λ0( т ) опыт( Z( т )'β)λ(T)знак равноλ0(T)ехр⁡(Z(T)'β)\lambda(t) = \lambda_0(t) \exp(Z(t)'\beta) Хотя я проходил курс «Выживание», я помню, что прямая производная функции кумулятивной...

13
дисперсия в summary.glm ()

Я провел glm.nb по glm1<-glm.nb(x~factor(group)) с группой, являющейся категориальной, и х, являющейся метрической переменной. Когда я пытаюсь получить сводку результатов, я получаю немного разные результаты, в зависимости от того, использую я summary()или summary.glm. summary(glm1)дает мне ......

13
Различие между линейной и нелинейной моделью

Я прочитал некоторые объяснения о свойствах линейных и нелинейных моделей, но все же иногда я не уверен, является ли имеющаяся модель линейной или нелинейной. Например, является ли следующая модель линейной или нелинейной? YT= β0+ β1B ( L ; θ ) XT+ εTyt=β0+β1B(L;θ)Xt+εty_t=\beta_0 +...