Вопросы с тегом «r»

18

Когда вы строите биплот для анализа PCA, у вас есть оценки PC1 основного компонента по оси x и оценки PC2 по оси y. Но каковы две другие оси справа и сверху

r pca biplot

18

Какова связь между вероятностью профиля и доверительными интервалами?

Для построения этой диаграммы я сгенерировал случайные выборки разного размера из нормального распределения со средним значением = 0 и sd = 1. Затем были рассчитаны доверительные интервалы с использованием альфа-срезов в диапазоне от 0,001 до 0,999 (красная линия) с помощью функции t.test (),...

r confidence-interval profile-likelihood

18

Алгоритмы кластеризации, работающие с разреженными матрицами данных [закрыто]

Закрыто. Этот вопрос не по теме . В настоящее время не принимает ответы. Хотите улучшить этот вопрос? Обновите вопрос, чтобы он соответствовал теме перекрестной проверки. Закрыто 5 лет назад . Я пытаюсь составить список алгоритмов кластеризации, которые: Реализовано в R Работа с разреженными...

r clustering sparse

18

Как вычислить стандартные ошибки коэффициентов логистической регрессии

Я использую Python Scikit-Learn для обучения и проверки логистической регрессии. scikit-learn возвращает коэффициенты регрессии независимых переменных, но не предоставляет стандартных ошибок коэффициентов. Мне нужны эти стандартные ошибки для вычисления статистики Вальда для каждого коэффициента и,...

logistic python standard-error regression-coefficients scikit-learn

18

Изменчивость в результатах cv.glmnet

Я использую, cv.glmnetчтобы найти предикторов. Я использую следующие настройки: lassoResults<-cv.glmnet(x=countDiffs,y=responseDiffs,alpha=1,nfolds=cvfold) bestlambda<-lassoResults$lambda.min results<-predict(lassoResults,s=bestlambda,type="coefficients")...

r cross-validation feature-selection glmnet

18

Анализ расхождения Кульбака-Лейблера

Рассмотрим следующие два вероятностных распределения. P Q 0.01 0.002 0.02 0.004 0.03 0.006 0.04 0.008 0.05 0.01 0.06 0.012 0.07 0.014 0.08 0.016 0.64 0.928 Я рассчитал дивергенцию Кульбака-Лейблера, равную , я хочу знать, в целом, что показывает это число? Вообще, дивергенция Кульбака-Лейблера...

interpretation information-theory kullback-leibler

18

Отрицательно-биномиальное GLM против логарифмического преобразования для данных подсчета: повышенная частота ошибок типа I

Некоторые из вас, возможно, читали эту прекрасную статью: O'Hara RB, Kotze DJ (2010) Не регистрируйте данные преобразований. Методы в экологии и эволюции 1: 118–122. Клик . В моей области исследований (экотоксикология) мы имеем дело с плохо реплицированными экспериментами, и GLM не используются...

r generalized-linear-model simulation negative-binomial type-i-and-ii-errors

18

Использование начальной загрузки под H0 для проведения теста на разницу двух средств: замена в группах или в объединенном образце

Предположим, у меня есть данные с двумя независимыми группами: g1.lengths <- c (112.64, 97.10, 84.18, 106.96, 98.42, 101.66) g2.lengths <- c (84.44, 82.10, 83.26, 81.02, 81.86, 86.80, 85.84, 97.08, 79.64, 83.32, 91.04, 85.92, 73.52, 85.58, 97.70, 89.72, 88.92, 103.72, 105.02, 99.48, 89.50,...

r hypothesis-testing bootstrap small-sample permutation-test

18

Что означает «зависимый» и «независимый» тесты в литературе по множественным сравнениям?

В литературе как по частоте появления ошибок (FWER), так и по частоте ложных обнаружений (FDR) конкретные методы контроля FWER или FDR считаются подходящими для зависимых или независимых тестов. Например, в статье 1979 года «Простая последовательная объективная процедура множественных испытаний»...

multiple-comparisons independence non-independent familywise-error false-discovery-rate

18

Обнаружение изменений во временных рядах (пример R)

Я хотел бы обнаружить изменения в данных временных рядов, которые обычно имеют одинаковую форму. До сих пор я работал с changepointпакетом для R cpt.mean(), cpt.var()и cpt.meanvar()функций и. cpt.mean()с методом PELT хорошо работает, когда данные обычно остаются на одном уровне. Однако я также...

r time-series change-point structural-change

18

Почему статистика разрыва для k-средних предполагает один кластер, хотя, очевидно, их два?

Я использую K-средства для кластеризации своих данных и искал способ предложить «оптимальный» номер кластера. Статистика зазоров, кажется, является распространенным способом найти хороший номер кластера. По некоторым причинам он возвращает 1 в качестве оптимального номера кластера, но когда я...

r machine-learning clustering k-means

18

Интерпретация провала Хартиганса

Я хотел бы найти способ количественно оценить интенсивность бимодальности некоторых распределений, которые я получил эмпирически. Из того, что я прочитал, до сих пор идут споры о том, как количественно определить бимодальность. Я решил использовать тест Хартиганса, который кажется единственным,...

r distributions

18

В чем проблема с эмпирическими приорами?

В литературе я иногда натыкаюсь на замечание, что выбор априорных значений, которые зависят от самих данных (например, Zellners g-prior), можно подвергнуть критике с теоретической точки зрения. Где именно проблема, если предшествующее не выбрано независимо от...

bayesian prior hierarchical-bayesian

18

В модели Пуассона, в чем разница между использованием времени как ковариаты или смещения?

Недавно я обнаружил, как моделировать экспозиции во времени, используя журнал (например) времени как смещение в регрессии Пуассона. Я понял, что смещение соответствует времени как ковариации с коэффициентом 1. Я хотел бы лучше понять разницу между использованием времени в качестве смещения или в...

poisson-regression predictor offset

18

Хороший пример, где ряд без единичного корня не является стационарным?

Я видел, как несколько раз люди отклоняли нуль в расширенном тесте Дики-Фуллера , а затем утверждали, что он показывает, что их ряды стационарны (к сожалению, я не могу показать источники этих утверждений, но я думаю, что подобные утверждения существуют здесь и там в тот или иной журнал). Я...

time-series unit-root stationarity augmented-dickey-fuller

18

Преимущества оптимизации роя частиц по сравнению с байесовской оптимизацией для настройки гиперпараметра?

Существуют современные исследования байесовской оптимизации (1) для настройки гиперпараметров ML. Мотивация здесь заключается в том, что требуется минимальное количество точек данных, чтобы сделать осознанный выбор того, какие точки стоит попробовать (вызовы целевых функций стоят дорого, поэтому...

hyperparameter bayesian-optimization optunity

18

Как обрабатывать порядковую категориальную переменную как независимую переменную

Я использую модель Logit. Моя зависимая переменная является двоичной. Однако у меня есть независимая переменная , которая является категоричным и содержит ответы: 1.very good, 2.good, 3.average, 4.poor and 5.very poor. Итак, это порядковый номер («количественный категориальный»). Я не уверен, как...

regression logistic ordinal-data predictor

18

k-NN вычислительная сложность

Какова временная сложность алгоритма k -NN с наивным поисковым подходом (без дерева kd или подобных)? Меня интересует его временная сложность, учитывая также гиперпараметр k . Я нашел противоречивые ответы: O (nd + kn), где n - количество обучающих наборов, а d - размерность каждой выборки. [1] O...

k-nearest-neighbour time-complexity

18

что делает нейронные сети нелинейной классификационной моделью?

Я пытаюсь понять математический смысл нелинейных классификационных моделей: Я только что прочитал статью о том, что нейронные сети являются нелинейной классификационной моделью. Но я просто понимаю, что: Первый слой: h1=x1∗wx1h1+x2∗wx1h2h1=x1∗wx1h1+x2∗wx1h2h_1=x_1∗w_{x1h1}+x_2∗w_{x1h2}...

neural-networks nonlinear-regression nonlinear

18

Как выполнить специальный тест на модели Lmer?

Это мой фрейм данных: Group <- c("G1","G1","G1","G1","G1","G1","G1","G1","G1","G1","G1","G1","G1","G1","G1","G2","G2","G2","G2","G2","G2","G2","G2","G2","G2","G2","G2","G2","G2","G2","G3","G3","G3","G3","G3","G3","G3","G3","G3","G3","G3","G3","G3","G3","G3") Subject <-...

r lme4-nlme post-hoc