Вопросы с тегом «r»

32
Как мне соответствовать многоуровневой модели для перераспределенных результатов по пуассону?

Я хочу установить многоуровневый GLMM с распределением Пуассона (с избыточной дисперсией), используя R. В настоящее время я использую lme4, но я заметил, что недавно quasipoissonсемейство было удалено. В другом месте я видел, что вы можете моделировать аддитивную избыточную дисперсию для...

32
Как изменить данные между широким и длинным форматами в R? [закрыто]

Вы можете иметь данные в широком формате или в длинном формате. Это довольно важная вещь, так как используемые методы различаются в зависимости от формата. Я знаю, что вы должны работать melt()иcast() пакетом измененных форм из него, но есть некоторые вещи, которые я не понимаю. Может кто-нибудь...

32
Сравнение двух моделей с использованием функции anova () в R

Из документации для anova(): Когда задана последовательность объектов, anova проверяет модели друг против друга в указанном порядке ... Что значит проверять модели друг против друга? И почему порядок имеет значение? Вот пример из учебника GenABEL : > modelAdd = lm(qt~as.numeric(snp1)) >...

31
Коэффициенты регрессии, которые переворачивают знак после включения других предикторов

Представить Вы запускаете линейную регрессию с четырьмя числовыми предикторами (IV1, ..., IV4) Когда в качестве предиктора включен только IV1, стандартизированная бета +.20 Когда вы также включаете IV2-IV4, знак стандартизированного коэффициента регрессии IV1 меняется на -.25(т.е. он становится...

31
Рекомендации по цвету и толщине линий для линейных участков

Много было написано о выборе цвета, удобного для слепых, для карт, полигонов и заштрихованных областей в целом (см., Например, http://colorbrewer2.org ). Мне не удалось найти рекомендации по цветам линий и различной толщине линий для линейных графиков. Цели: легко различать линии, даже когда они...

31
Как повысить долгосрочную воспроизводимость исследований (особенно с использованием R и Sweave)

Контекст: в ответ на предыдущий вопрос о воспроизводимых исследованиях Джейк написал Одна проблема, которую мы обнаружили при создании нашего архива JASA, заключалась в том, что версии и значения по умолчанию пакетов CRAN изменились. Итак, в этот архив мы также включили версии пакетов, которые мы...

31
В чем разница между задним и задним предиктивным распределением?

Я понимаю, что такое апостериор, но я не уверен, что означает последний? Чем отличаются 2? Кевин П. Мерфи указал в своем учебнике « Машинное обучение: вероятностная перспектива» , что это «состояние внутреннего убеждения». Что это на самом деле означает? У меня сложилось впечатление, что Приор...

31
Если вероятный интервал имеет ровный априор, равен ли доверительный интервал 95% доверительному интервалу 95%?

Я очень плохо знаком с байесовской статистикой, и это может быть глупым вопросом. тем не менее: Рассмотрим вероятный интервал с априором, который определяет равномерное распределение. Например, от 0 до 1, где от 0 до 1 представляет полный диапазон возможных значений эффекта. В этом случае будет ли...

31
Можно ли рассчитать AIC и BIC для моделей лассо-регрессии?

Можно ли рассчитать значения AIC или BIC для моделей лассо-регрессии и других регуляризованных моделей, где параметры только частично входят в уравнение. Как определить степени свободы? Я использую R для подбора моделей регрессии Лассо с помощью glmnet()функции из glmnetпакета, и я хотел бы знать,...

31
Многократные сравнения на модели смешанных эффектов

Я пытаюсь проанализировать некоторые данные, используя модель смешанного эффекта. Собранные мной данные показывают вес некоторых молодых животных с различным генотипом с течением времени. Я использую предлагаемый здесь подход:...

31
Для каких распределений параметры параметризации в BUGS и R различны?

Я нашел несколько дистрибутивов, для которых BUGS и R имеют разные параметризации: Normal, log-Normal и Weibull. Для каждого из них я понимаю, что второй параметр, используемый R, необходимо преобразовать в обратном направлении (1 / параметр), прежде чем использовать в BUGS (или в моем случае...

31
Как построить границу решения классификатора k-ближайшего соседа из элементов статистического обучения?

Я хочу создать сюжет, описанный в книге ElemStatLearn «Элементы статистического обучения: сбор данных, вывод и прогноз. Второе издание» Тревора Хасти, Роберта Тибширани и Джерома Фридмана. Сюжет: Мне интересно, как я могу получить этот точный график R, особенно обратите внимание на графику сетки и...

31
Уменьшение размерности (SVD или PCA) на большой разреженной матрице

/ edit: далее следите, теперь вы можете использовать irlba :: prcomp_irlba / edit: следите за своим собственным постом. irlbaтеперь имеет аргументы "center" и "scale", которые позволяют использовать его для вычисления основных компонентов, например: pc <- M %*% irlba(M, nv=5, nu=0,...

31
Каковы некоторые полезные рекомендации для параметров GBM?

Каковы некоторые полезные рекомендации для тестирования параметров (например, глубина взаимодействия, minchild, частота выборки и т. Д.) С использованием GBM? Допустим, у меня 70-100 функций, население 200 000, и я собираюсь проверить глубину взаимодействия 3 и 4. Очевидно, мне нужно провести...

31
Интуиция за взаимодействиями тензорных произведений в GAM (пакет MGCV в R)

Обобщенными аддитивными моделями являются те, где Y= α + f1( х1) + f2( х2) + еяy=α+f1(x1)+f2(x2)+ei y = \alpha + f_1(x_1) + f_2(x_2) + e_i например. функции гладкие и должны быть оценены. Обычно по штрафным сплайнам. MGCV - это пакет в R, который делает это, и автор (Саймон Вуд) пишет книгу о своем...

31
Относительная важность набора предикторов в классификации случайных лесов в R

Я хотел бы определить относительную важность наборов переменных для randomForestмодели классификации в R. importanceФункция предоставляет MeanDecreaseGiniметрику для каждого отдельного предиктора - это так же просто, как суммировать это для каждого предиктора в наборе? Например: # Assumes df has...

31
Линейный график имеет слишком много линий, есть ли лучшее решение?

Я пытаюсь составить график количества действий пользователей (в данном случае «лайков») с течением времени. Таким образом, у меня есть «Количество действий» в качестве моей оси Y, моя ось X - время (недели), и каждая строка представляет одного пользователя. Моя проблема в том, что я хочу посмотреть...

31
Статистические методы для более эффективного построения данных, когда присутствуют миллионы точек?

Я считаю, что R может занять много времени для создания графиков, когда присутствуют миллионы точек - неудивительно, учитывая, что точки строятся индивидуально. Кроме того, такие графики часто слишком загромождены и плотны, чтобы быть полезными. Многие из точек перекрываются и образуют черную...

31
Визуализация миллиона, выпуск PCA

Можно ли визуализировать результаты анализа основных компонентов способами, которые дают больше понимания, чем просто сводные таблицы? Возможно ли это сделать, когда число наблюдений велико, скажем, ~ 1e4? И возможно ли это сделать в R [приветствуются другие...

30
Какая разница инфляции фактор я должен использовать:

Я пытаюсь интерпретировать дисперсии коэффициентов инфляции с использованием vifфункции в пакете R car. Функция печатает как обобщенный и . Согласно файлу справки , это последнее значениеVIFVIF\text{VIF}GVIF1/(2⋅df)GVIF1/(2⋅df)\text{GVIF}^{1/(2\cdot\text{df})} Чтобы настроить размер доверительного...