Когда вы строите биплот для анализа PCA, у вас есть оценки PC1 основного компонента по оси x и оценки PC2 по оси y. Но каковы две другие оси справа и сверху
Когда вы строите биплот для анализа PCA, у вас есть оценки PC1 основного компонента по оси x и оценки PC2 по оси y. Но каковы две другие оси справа и сверху
Для построения этой диаграммы я сгенерировал случайные выборки разного размера из нормального распределения со средним значением = 0 и sd = 1. Затем были рассчитаны доверительные интервалы с использованием альфа-срезов в диапазоне от 0,001 до 0,999 (красная линия) с помощью функции t.test (),...
Закрыто. Этот вопрос не по теме . В настоящее время не принимает ответы. Хотите улучшить этот вопрос? Обновите вопрос, чтобы он соответствовал теме перекрестной проверки. Закрыто 5 лет назад . Я пытаюсь составить список алгоритмов кластеризации, которые: Реализовано в R Работа с разреженными...
Я использую Python Scikit-Learn для обучения и проверки логистической регрессии. scikit-learn возвращает коэффициенты регрессии независимых переменных, но не предоставляет стандартных ошибок коэффициентов. Мне нужны эти стандартные ошибки для вычисления статистики Вальда для каждого коэффициента и,...
Я использую, cv.glmnetчтобы найти предикторов. Я использую следующие настройки: lassoResults<-cv.glmnet(x=countDiffs,y=responseDiffs,alpha=1,nfolds=cvfold) bestlambda<-lassoResults$lambda.min results<-predict(lassoResults,s=bestlambda,type="coefficients")...
Рассмотрим следующие два вероятностных распределения. P Q 0.01 0.002 0.02 0.004 0.03 0.006 0.04 0.008 0.05 0.01 0.06 0.012 0.07 0.014 0.08 0.016 0.64 0.928 Я рассчитал дивергенцию Кульбака-Лейблера, равную , я хочу знать, в целом, что показывает это число? Вообще, дивергенция Кульбака-Лейблера...
Некоторые из вас, возможно, читали эту прекрасную статью: O'Hara RB, Kotze DJ (2010) Не регистрируйте данные преобразований. Методы в экологии и эволюции 1: 118–122. Клик . В моей области исследований (экотоксикология) мы имеем дело с плохо реплицированными экспериментами, и GLM не используются...
Предположим, у меня есть данные с двумя независимыми группами: g1.lengths <- c (112.64, 97.10, 84.18, 106.96, 98.42, 101.66) g2.lengths <- c (84.44, 82.10, 83.26, 81.02, 81.86, 86.80, 85.84, 97.08, 79.64, 83.32, 91.04, 85.92, 73.52, 85.58, 97.70, 89.72, 88.92, 103.72, 105.02, 99.48, 89.50,...
В литературе как по частоте появления ошибок (FWER), так и по частоте ложных обнаружений (FDR) конкретные методы контроля FWER или FDR считаются подходящими для зависимых или независимых тестов. Например, в статье 1979 года «Простая последовательная объективная процедура множественных испытаний»...
Я хотел бы обнаружить изменения в данных временных рядов, которые обычно имеют одинаковую форму. До сих пор я работал с changepointпакетом для R cpt.mean(), cpt.var()и cpt.meanvar()функций и. cpt.mean()с методом PELT хорошо работает, когда данные обычно остаются на одном уровне. Однако я также...
Я использую K-средства для кластеризации своих данных и искал способ предложить «оптимальный» номер кластера. Статистика зазоров, кажется, является распространенным способом найти хороший номер кластера. По некоторым причинам он возвращает 1 в качестве оптимального номера кластера, но когда я...
Я хотел бы найти способ количественно оценить интенсивность бимодальности некоторых распределений, которые я получил эмпирически. Из того, что я прочитал, до сих пор идут споры о том, как количественно определить бимодальность. Я решил использовать тест Хартиганса, который кажется единственным,...
В литературе я иногда натыкаюсь на замечание, что выбор априорных значений, которые зависят от самих данных (например, Zellners g-prior), можно подвергнуть критике с теоретической точки зрения. Где именно проблема, если предшествующее не выбрано независимо от...
Недавно я обнаружил, как моделировать экспозиции во времени, используя журнал (например) времени как смещение в регрессии Пуассона. Я понял, что смещение соответствует времени как ковариации с коэффициентом 1. Я хотел бы лучше понять разницу между использованием времени в качестве смещения или в...
Я видел, как несколько раз люди отклоняли нуль в расширенном тесте Дики-Фуллера , а затем утверждали, что он показывает, что их ряды стационарны (к сожалению, я не могу показать источники этих утверждений, но я думаю, что подобные утверждения существуют здесь и там в тот или иной журнал). Я...
Существуют современные исследования байесовской оптимизации (1) для настройки гиперпараметров ML. Мотивация здесь заключается в том, что требуется минимальное количество точек данных, чтобы сделать осознанный выбор того, какие точки стоит попробовать (вызовы целевых функций стоят дорого, поэтому...
Я использую модель Logit. Моя зависимая переменная является двоичной. Однако у меня есть независимая переменная , которая является категоричным и содержит ответы: 1.very good, 2.good, 3.average, 4.poor and 5.very poor. Итак, это порядковый номер («количественный категориальный»). Я не уверен, как...
Какова временная сложность алгоритма k -NN с наивным поисковым подходом (без дерева kd или подобных)? Меня интересует его временная сложность, учитывая также гиперпараметр k . Я нашел противоречивые ответы: O (nd + kn), где n - количество обучающих наборов, а d - размерность каждой выборки. [1] O...
Я пытаюсь понять математический смысл нелинейных классификационных моделей: Я только что прочитал статью о том, что нейронные сети являются нелинейной классификационной моделью. Но я просто понимаю, что: Первый слой: h1=x1∗wx1h1+x2∗wx1h2h1=x1∗wx1h1+x2∗wx1h2h_1=x_1∗w_{x1h1}+x_2∗w_{x1h2}...
Это мой фрейм данных: Group <- c("G1","G1","G1","G1","G1","G1","G1","G1","G1","G1","G1","G1","G1","G1","G1","G2","G2","G2","G2","G2","G2","G2","G2","G2","G2","G2","G2","G2","G2","G2","G3","G3","G3","G3","G3","G3","G3","G3","G3","G3","G3","G3","G3","G3","G3") Subject <-...