Вопросы с тегом «r»

13

Как сгенерировать предсказанные кривые выживших из слабых моделей (используя R coxph)?

Я хочу вычислить предсказанную функцию выживания для модели пропорциональных рисков Кокса с ненадежными терминами [используя пакет выживания]. Похоже, что когда в модели присутствуют слабые члены, предсказанная функция выживания не может быть вычислена. ## Example require(survival) data(rats) ##...

r survival cox-model frailty

13

Работа со связями, весами и голосованием в кНН

Я программирую алгоритм kNN и хотел бы знать следующее: Тай-брейки: Что произойдет, если в голосовании большинства нет явного победителя? Например, все k ближайших соседей принадлежат к разным классам, или для k = 4 есть 2 соседа из класса A и 2 соседа из класса B? Что происходит, если невозможно...

k-nearest-neighbour weights ties

13

Понимание прогнозов из логистической регрессии

Мои прогнозы, основанные на модели логистической регрессии (glm в R), не ограничены между 0 и 1, как я ожидал. Мое понимание логистической регрессии состоит в том, что ваши входные параметры и параметры модели объединяются линейно, и ответ преобразуется в вероятность с помощью функции связи logit....

r regression logistic generalized-linear-model

13

Эффективный размер выборки для последующего вывода из выборки MCMC

При получении образцов MCMC для определения конкретного параметра, каковы хорошие ориентиры для минимального количества эффективных образцов, к которым следует стремиться? И меняется ли этот совет по мере того, как модель становится более или менее...

bayesian sample-size mcmc posterior

13

Для случайной матрицы разве SVD не должен вообще ничего объяснять? Что я делаю неправильно?

Если бы я построил двумерную матрицу, состоящую полностью из случайных данных, я ожидал бы, что компоненты PCA и SVD по существу ничего не объясняют. Вместо этого кажется, что первый столбец SVD, кажется, объясняет 75% данных. Как это может быть? Что я делаю неправильно? Вот сюжет: Вот код R:...

r pca svd

13

Термины взаимодействия и полиномы высших порядков

Если бы меня интересовало согласование двусторонних взаимодействий между линейной объясняющей переменной и другой объясняющей переменной b, которая имеет квадратичную связь с зависимой переменной y , мне бы пришлось включить как взаимодействие с квадратичным компонентом, так и взаимодействие с...

r regression model-selection

13

R-квадрат в линейной модели отклонения стихов в обобщенной линейной модели?

Вот мой контекст для этого вопроса: Из того, что я могу сказать, мы не можем запустить обычную регрессию наименьших квадратов в R при использовании взвешенных данных и surveyпакета. Здесь мы должны использовать svyglm(), который вместо этого запускает обобщенную линейную модель (что может быть тем...

r generalized-linear-model least-squares r-squared deviance

13

Кластер больших данных в R и имеет ли значение выборка?

Я новичок в науке о данных, и у меня проблема с поиском кластеров в наборе данных с 200 000 строк и 50 столбцов в R. Поскольку данные имеют как числовые, так и номинальные переменные, такие методы, как K-средства, которые используют евклидову меру расстояния, не кажутся подходящим выбором. Поэтому...

r clustering sampling large-data

13

Как вычислить повернутые варимаксом главные компоненты в R?

Я запустил PCA на 25 переменных и выбрал лучшие 7 компьютеров, используя prcomp. prc <- prcomp(pollutions, center=T, scale=T, retx=T) Затем я сделал ротацию варимакса для этих компонентов. varimax7 <- varimax(prc$rotation[,1:7]) А теперь я хочу, чтобы varimax вращал данные, повернутые PCA...

r pca factor-rotation

13

Интерполяция данных по гриппу, сохраняющих среднее значение за неделю

редактировать Я нашел статью с описанием именно той процедуры, которая мне нужна. Единственное отличие состоит в том, что документ интерполирует среднемесячные данные на ежедневные, сохраняя при этом среднемесячные значения. У меня есть проблемы, чтобы реализовать подход в R. Любые намеки...

r time-series interpolation

13

Структурные уравнения: как задать эффекты взаимодействия в пакете R lavaan

Я использую R-пакет Lavaan для оценки модели структурного уравнения. Допустим, модель состоит из 1 эндогенной манифестной переменной с 1 скрытой и 2 манифестными объясняющими переменными: group = {0,1} attitude1 = latent,scale age = respondent's age Тогда желаемая модель лавы (не работает): model...

r interaction sem lavaan

13

Коэффициенты пути - сравнение регрессии гребня, лассо и эластичной сетки

Я хотел бы сравнить модели, выбранные с ребристой, лассо и эластичной сеткой. На рисунке ниже показаны коэффициенты пути, используя все 3 метода: гребень (рис. A, альфа = 0), лассо (рис. B; альфа = 1) и эластичная сетка (рис. C; альфа = 0,5). Оптимальное решение зависит от выбранного значения...

r multiple-regression modeling regularization

13

Линейная и нелинейная регрессия

У меня есть набор значений и которые теоретически связаны экспоненциально:xxxyyy y=axby=axby = ax^b Одним из способов получения коэффициентов является применение натуральных логарифмов с обеих сторон и подгонка линейной модели: > fit <- lm(log(y)~log(x)) > a <- exp(fit$coefficients[1])...

r regression linear-model model-selection nonlinear-regression

13

Боксплотный эквивалент для дистрибутивов с тяжелыми хвостами?

Для приблизительно нормально распределенных данных коробочные диаграммы - отличный способ быстро визуализировать медиану и распространение данных, а также присутствие любых выбросов. Однако для распределений с более тяжелыми хвостами многие точки показаны как выбросы, поскольку выбросы определяются...

r distributions data-visualization data-transformation ggplot2

13

Тест суммы рангов Уилкоксона в R

У меня есть результаты того же теста, примененного к двум независимым образцам: x <- c(17, 12, 13, 16, 9, 19, 21, 12, 18, 17) y <- c(10, 6, 15, 9, 8, 11, 8, 16, 13, 7, 5, 14) И я хочу вычислить критерий суммы рангов Уилкоксона. Когда я вручную вычисляю статистику , я получаю: TWTWT_{W}TW= ∑...

r wilcoxon-mann-whitney wilcoxon-signed-rank

13

Выбор подходящего размера мини-партии для стохастического градиентного спуска (SGD)

Есть ли литература, в которой рассматривается выбор размера мини-партии при выполнении стохастического градиентного спуска? По моему опыту, это, кажется, эмпирический выбор, обычно находящийся в перекрестной проверке или с использованием различных практических правил. Является ли хорошей идеей...

machine-learning gradient-descent hyperparameter deep-learning

13

Как оценить базовую функцию опасности в модели Кокса с R

Мне нужно оценить базовую функцию риска λ0( т )λ0(T)\lambda_0(t) в зависящей от времени модели Кокса λ ( t ) = λ0( т ) опыт( Z( т )'β)λ(T)знак равноλ0(T)ехр⁡(Z(T)'β)\lambda(t) = \lambda_0(t) \exp(Z(t)'\beta) Хотя я проходил курс «Выживание», я помню, что прямая производная функции кумулятивной...

r survival cox-model

13

дисперсия в summary.glm ()

Я провел glm.nb по glm1<-glm.nb(x~factor(group)) с группой, являющейся категориальной, и х, являющейся метрической переменной. Когда я пытаюсь получить сводку результатов, я получаю немного разные результаты, в зависимости от того, использую я summary()или summary.glm. summary(glm1)дает мне ......

r generalized-linear-model negative-binomial

13

Анализ мощности для теста Крускала-Уоллиса или Манна-Уитни с использованием R?

Можно ли провести анализ мощности для U-теста Крускала-Уоллиса и Манна-Уитни? Если да, есть ли пакеты / функции R, которые его

r nonparametric power-analysis kruskal-wallis

13

Различие между линейной и нелинейной моделью

Я прочитал некоторые объяснения о свойствах линейных и нелинейных моделей, но все же иногда я не уверен, является ли имеющаяся модель линейной или нелинейной. Например, является ли следующая модель линейной или нелинейной? YT= β0+ β1B ( L ; θ ) XT+ εTyt=β0+β1B(L;θ)Xt+εty_t=\beta_0 +...

linear-model nonlinear-regression nonlinear