Вопросы с тегом «r»

13
Как модели машинного обучения (GBM, NN и т. Д.) Можно использовать для анализа выживания?

Я знаю, что традиционные статистические модели, такие как регрессия пропорциональных рисков Кокса и некоторые модели Каплана-Мейера, могут использоваться для прогнозирования дней до следующего возникновения события, скажем, провала и т. Д., Т. Е. Анализа выживания Вопросов Как можно использовать...

13
Каковы были основные статистические данные Рональда Фишера?

Ричард Докинз назвал Рональда Фишера «отцом современной статистики и экспериментального дизайна», и эта строка цитируется в биографии Википедии Фишера . А также Андерс Халд назвал его «гением, который почти в одиночку создал основы современной статистической науки» в своей книге «История...

13
В чем разница между логистической регрессией и регрессией дробного ответа?

Насколько я знаю, разница между логистической моделью и моделью дробного отклика (frm) заключается в том, что зависимая переменная (Y), в которой frm равна [0,1], но логистика - {0, 1}. Кроме того, frm использует оценку квази-правдоподобия для определения своих параметров. Обычно мы можем...

13
Создание байесовского априора по частому результату

Как можно превратить частый результат в байесовский априор? Рассмотрим следующий довольно общий сценарий: в прошлом проводился эксперимент и измерялся результат по некоторому параметру . Анализ был сделан с использованием методологии частых исследований. В результатах указан доверительный интервал...

13
Пакет GBM против Карет с использованием GBM

Я занимался настройкой модели caret, но затем перезапустил модель, используя gbmпакет. Насколько я понимаю, caretпакет использует gbmи вывод должен быть одинаковым. Тем не менее, только быстрый запуск теста data(iris)показывает несоответствие в модели около 5% с использованием RMSE и R ^ 2 в...

13
Что r, r в квадрате и остаточное стандартное отклонение говорят нам о линейных отношениях?

Немного предыстории Я работаю над интерпретацией регрессионного анализа, но я действительно запутался в значении r, r в квадрате и остаточного стандартного отклонения. Я знаю определения: характеризации r измеряет силу и направление линейной зависимости между двумя переменными на диаграмме...

13
Как запустить линейную регрессию в параллельном / распределенном режиме для настройки больших данных?

Я работаю над очень большой проблемой линейной регрессии, когда размер данных настолько велик, что их нужно хранить на кластере машин. Он будет слишком большим, чтобы объединить все образцы в память одного компьютера (даже диска). Чтобы выполнить регрессию этих данных, я думаю о параллельном...

13
Гармоническое среднее минимизирует сумму квадратов относительных ошибок

Я ищу ссылку, где доказано, что гармоническое среднее x¯h=n∑ni=11xix¯h=n∑i=1n1xi\bar{x}^h = \frac{n}{\sum_{i=1}^n \frac{1}{x_i}} минимизирует (в zzz ) сумму квадратов относительных ошибок ∑i=1n((xi−z)2xi).∑i=1n((xi−z)2xi).\sum_{i=1}^n \left( \frac{(x_i -...

13
В линейной регрессии, почему переменная отклика должна быть непрерывной?

Я знаю, что в линейной регрессии переменная отклика должна быть непрерывной, но почему это так? Кажется, я не могу найти в Интернете ничего, что объясняет, почему я не могу использовать дискретные данные для переменной...

13
Эквивалентность (0 + фактор | группа) и (1 | группа) + (1 | группа: фактор) характеристики случайных эффектов в случае составной симметрии

Дуглас Бейтс утверждает, что следующие модели эквивалентны «если матрица дисперсии-ковариации для векторно-значных случайных эффектов имеет особую форму, называемую составной симметрией» ( слайд 91 в этой презентации ): m1 <- lmer(y ~ factor + (0 + factor|group), data) m2 <- lmer(y ~ factor +...

13
Могу ли я использовать CLR (центрированное преобразование логарифмического отношения) для подготовки данных для PCA?

Я использую скрипт. Это для основных записей. У меня есть датафрейм, который показывает различные элементные композиции в столбцах на заданной глубине (в первом столбце). Я хочу провести с ним PCA, и меня не устраивает метод стандартизации, который я должен выбрать. Кто-нибудь из вас использовал...

13
Формат ввода ответа в биномиальном glm в R

В России Rсуществует три метода форматирования входных данных для логистической регрессии с использованием glmфункции: Данные могут быть в «двоичном» формате для каждого наблюдения (например, y = 0 или 1 для каждого наблюдения); Данные могут быть в формате «Уилкинсон-Роджерс» (например, y =...

13
Подходят ли методы, основанные на MCMC, когда доступна максимальная апостериорная оценка?

Я заметил, что во многих практических применениях методы, основанные на MCMC, используются для оценки параметра, даже если апостериорный является аналитическим (например, потому что приоры были сопряженными). Для меня имеет смысл использовать MAP-оценки, а не MCMC-оценки. Может ли кто-нибудь...

13
Является ли порог принятия решения гиперпараметром в логистической регрессии?

Прогнозируемые классы из (двоичной) логистической регрессии определяются с использованием порога вероятностей членства в классе, генерируемых моделью. Насколько я понимаю, обычно используется 0.5 по умолчанию. Но изменение порога изменит предсказанные классификации. Означает ли это, что порог...

12
Адаптивные оценки плотности ядра?

Кто-нибудь может сообщить о своем опыте с адаптивной оценкой плотности ядра? (Существует много синонимов: адаптивный | переменная | переменная-ширина, KDE | гистограмма | интерполятор ...) Переменная оценка плотности ядра говорит: «мы меняем ширину ядра в разных областях выборочного пространства....

12
Анализ предметов для новичка R

Я пытаюсь оценить 20-элементный тест на выбор нескольких множителей. Я хочу выполнить анализ элемента, который можно найти в этом примере . Поэтому для каждого вопроса я хочу получить P-значение и корреляцию с итогом, а также распределение выбранных опций. Я ничего не знаю о различных...

12
Как взять много образцов из 10 из большого списка, без полной замены

У меня есть большой набор данных (20 000 точек данных), из которого я хочу взять повторные выборки из 10 точек данных. Однако, как только я выбрал эти 10 точек данных, я хочу, чтобы они больше не выбирались. Я пытался использовать sampleфункцию, но, похоже, у нее нет возможности сэмплировать без...

12
Лучшая классификация дефолта в логистической регрессии

Полное раскрытие: это домашнее задание. Я включил ссылку на набор данных ( http://www.bertelsen.ca/R/logistic-regression.sav ) Моя цель - максимально повысить прогноз неплательщиков кредитов в этом наборе данных. Каждая модель, которую я придумала до сих пор, предсказывает> 90% неплательщиков,...

12
Как можно проверить гипотезу MCMC на регрессионной модели со смешанным эффектом со случайными наклонами?

Библиотека languageR предоставляет метод (pvals.fnc) для проверки значимости MCMC фиксированных эффектов в модели регрессии смешанного эффекта, подходящей с использованием lmer. Однако pvals.fnc выдает ошибку, когда модель lmer включает случайные наклоны. Есть ли способ сделать проверку гипотезы...