Вопросы с тегом «r»

28
Существуют ли функции по умолчанию для дискретных равномерных распределений в R?

Большинство стандартных дистрибутивов в R имеют семейство команд - pdf / pmf, cdf / cmf, квантиль, случайные отклонения (например, dnorm, pnorm, qnorm, rnorm). Я знаю, что достаточно просто использовать некоторые стандартные команды для воспроизведения этих функций для дискретных равномерных...

28
Кому следовать на github, чтобы узнать о передовом опыте в анализе данных?

Полезно изучить код анализа данных экспертов. Недавно я просматривал github, и многие люди делятся там кодом анализа данных. Это включает в себя несколько пакетов R (которые, конечно, доступны непосредственно из CRAN), а также несколько примеров воспроизводимых исследований, особенно с...

28
Как бороться с мультиколлинеарностью при выборе переменных?

У меня есть набор данных с 9 непрерывными независимыми переменными. Я пытаюсь выбрать среди этих переменных, чтобы подогнать модель к одной процентной (зависимой) переменной Score. К сожалению, я знаю, что между несколькими переменными будет серьезная коллинеарность. Я пытался использовать...

28
Насколько некорректна модель регрессии, когда предположения не выполняются?

При подборе регрессионной модели, что произойдет, если предположения о выходных данных не будут выполнены, а именно Что произойдет, если остатки не будут гомоскедастичными? Если остатки показывают растущий или убывающий паттерн на графике Остатки против Приспособленного. Что произойдет, если...

28
Вычисление повторяемости эффектов по модели Лмера

Я только что наткнулся на эту статью , в которой описывается, как вычислить повторяемость (или надежность, или внутриклассовую корреляцию) измерения с помощью моделирования смешанных эффектов. Код R будет: #fit the model fit = lmer(dv~(1|unit),data=my_data) #obtain the variance estimates vc =...

28
Почему регрессия glmnet ridge дает мне другой ответ, чем ручной расчет?

Я использую glmnet для расчета оценок регрессии гребня. Я получил некоторые результаты, которые сделали меня подозрительным в том, что glmnet действительно делает то, что я думаю, что делает. Чтобы проверить это, я написал простой R-скрипт, в котором я сравниваю результат регрессии гребня,...

28
Адаптация расстояния Кульбака-Лейблера?

Посмотри на эту картину: Если мы возьмем образец из красной плотности, то ожидается, что некоторые значения будут меньше 0,25, тогда как невозможно получить такой образец из синего распределения. Как следствие, расстояние Кульбака-Лейблера от красной плотности до голубой плотности равно...

28
Значение «Частота» для данных интервалов секунд / минут в R

Я использую R (3.1.1) и модели ARIMA для прогнозирования. Я хотел бы знать, каким должен быть параметр «частоты», который назначается в ts()функции , если я использую данные временных рядов, которые: разделено минутами и распространяется в течение 180 дней (1440 минут / день) отделяется секундами и...

28
Почему и когда создается пакет R?

Locked . Этот вопрос и его ответы заблокированы, потому что вопрос не по теме, но имеет историческое значение. В настоящее время он не принимает новые ответы или взаимодействия. Я понимаю, что этот вопрос довольно широкий, но мне интересно, какими должны быть решающие моменты при принятии решения...

27
Символьные вычисления в R?

Locked . Этот вопрос и его ответы заблокированы, потому что вопрос не по теме, но имеет историческое значение. В настоящее время он не принимает новые ответы или взаимодействия. Мне было интересно, если это возможно сделать символьные вычисления в R? Например, Я надеялся получить обратную...

27
Соответствующие остаточные степени свободы после отбрасывания членов из модели

Я размышляю над обсуждением этого вопроса и, в частности, комментарием Фрэнка Харрелла о том, что для оценки дисперсии в сокращенной модели (т. Е. Той, в которой ряд объясняющих переменных были проверены и отклонены) следует использовать Обобщенные степени свободы Йе . Профессор Харрелл указывает,...

27
Как добавить нелинейную линию тренда на график рассеяния в R? [закрыто]

Закрыто. Этот вопрос не по теме . В настоящее время не принимает ответы. Хотите улучшить этот вопрос? Обновите вопрос, чтобы он соответствовал теме перекрестной проверки. Закрыто в прошлом году . У меня есть точечный график. Как я могу добавить нелинейную линию...

27
Является ли расплывчатый априор таким же, как неинформативный априор?

Это вопрос о терминологии. Является ли «неопределенный априор» таким же, как неинформативный априор, или есть какая-то разница между ними? У меня сложилось впечатление, что они одинаковы (глядя нечетко и неинформативно), но я не...

27
Если линейная регрессия связана с корреляцией Пирсона, существуют ли какие-либо методы регрессии, связанные с корреляциями Кендалла и Спирмена?

Может быть, этот вопрос наивный, но: Если линейная регрессия тесно связана с коэффициентом корреляции Пирсона, существуют ли какие-либо методы регрессии, тесно связанные с коэффициентами корреляции Кендалла и...

27
Почему приоры Джеффриса считаются неинформативными?

Рассмотрим ранее Джеффриса, где , где - информация Фишера.p(θ)∝|i(θ)|−−−−√p(θ)∝|i(θ)|p(\theta) \propto \sqrt{|i(\theta)|}iii Я продолжаю видеть, что этот априор упоминается как неинформативный априор, но я никогда не видел аргумента, почему он неинформативен. В конце концов, это не постоянный...

27
Как использовать двоичные и непрерывные переменные вместе в кластеризации?

Мне нужно использовать двоичные переменные (значения 0 и 1) в k-средних. Но k-means работает только с непрерывными переменными. Я знаю, что некоторые люди все еще используют эти двоичные переменные в k-средних, игнорируя тот факт, что k-средние предназначены только для непрерывных переменных. Это...

27
Какая разница между дисперсией и среднеквадратичной ошибкой?

Я удивлен, что об этом раньше не спрашивали, но я не могу найти вопрос на stats.stackexchange. Это формула для расчета дисперсии нормально распределенной выборки: ∑ ( X- Х¯)2n - 1Σ(Икс-Икс¯)2N-1\frac{\sum(X - \bar{X}) ^2}{n-1} Это формула для расчета среднеквадратичной ошибки наблюдений в простой...

27
STL тренд временных рядов с использованием R

Я новичок в R и для анализа временных рядов. Я пытаюсь найти тренд длинного (40 лет) дневного временного ряда температуры и пробовал разные приближения. Первый - это простая линейная регрессия, а второй - сезонная декомпозиция временных рядов по Лесс. В последнем случае оказывается, что сезонная...