Вопросы с тегом «r»

10
Почему мы используем остатки для проверки предположений об ошибках в регрессии?

Предположим, что у нас есть модель .Yя= β0+ β1Икся 1+ β2Икся 2+ ⋯ + βКИкся к+ ϵяYязнак равноβ0+β1Икся1+β2Икся2+⋯+βКИксяК+εяY_i = \beta_0 + \beta_1X_{i1} + \beta_2X_{i2} + \dots + \beta_kX_{ik} + \epsilon_i Регрессия имеет ряд допущений, например, что ошибки должны обычно распределяться со средним...

10
Беспристрастная, положительная оценка для квадрата среднего

Предположим, у нас есть доступ к выборкам iid из распределения с истинным (неизвестным) средним и дисперсией , и мы хотим оценить .μ , σ2μ,σ2\mu, \sigma^2μ2μ2\mu^2 Как мы можем построить объективную, всегда положительную оценку этой величины? Взяв квадрат выборки, среднее значение смещено и будет...

10
Теорема об отсутствии свободного обеда и согласованность K-NN

В вычислительном обучении теорема НФЛ утверждает, что универсального ученика не существует. Для каждого алгоритма обучения существует распределение, которое приводит к тому, что учащийся выдает гипотезу с большой ошибкой и высокой вероятностью (хотя гипотеза с низкой ошибкой существует). Вывод...

9
Как мне вертикально сложить два графика с одинаковым масштабом x, но с другим масштабом y в R?

Приветствую, В настоящее время я делаю следующее в R: require(zoo) data <- read.csv(file="summary.csv",sep=",",head=TRUE) cum = zoo(data$dcomp, as.Date(data$date)) data = zoo(data$compressed, as.Date(data$date)) data <- aggregate(data, identity, tail, 1) cum <- aggregate(cum, identity,...

9
Многоходовая непараметрическая анова

Я должен проанализировать факторный дизайн с пятью факторами (один из них вложен в другой) и числовыми ответами. Я хотел бы выполнить непараметрическую ANOVA, но, конечно, я не могу использовать ни тест Крускалла Уоллиса, ни тест Фридмана (я повторил измерения). Есть ли команда или код в R, которые...

9
Могу ли я использовать тесты перестановок, чтобы избежать проблемы множественного сравнения в контексте пропорций?

Я оцениваю эффективность 5 различных методов для прогнозирования конкретного двоичного результата (назовите их «Успех» и «Неудача»). Данные выглядят так: Method Sample_Size Success Percent_Success 1 28 4 0.14 2 19 4 0.21 3 24 7 0.29 4 21 13 0.61 5 22 9 0.40 Я хотел бы провести тест среди этих 5...

9
Как создать диаграмму гистограммы, где столбцы расположены рядом в R

Locked . Этот вопрос и его ответы заблокированы, потому что вопрос не по теме, но имеет историческое значение. В настоящее время он не принимает новые ответы или взаимодействия. Я хочу создать bardiagram для этих данных в R (читать из файла CVS): Эксперимент_Имя метрикиА МетрикаБ Just_X 2 10...

9
Как построить веерную (полярную) дендрограмму в R?

Locked . Этот вопрос и его ответы заблокированы, потому что вопрос не по теме, но имеет историческое значение. В настоящее время он не принимает новые ответы или взаимодействия. Я имею в виду что-то вроде этого: Предлагаемый набор данных для показа решений: data(mtcars) plot(hclust(dist(mtcars)))...

9
Рассчитать кривую ROC для данных

Итак, у меня есть 16 испытаний, в которых я пытаюсь идентифицировать человека по биометрической характеристике, используя расстояние Хэмминга. Мой порог установлен на 3,5. Мои данные ниже, и только пробная версия 1 является истинным положительным результатом: Trial Hamming Distance 1 0.34 2 0.37 3...

9
Как повторно сэмплировать временной ряд XTS в R?

У меня нерегулярно разнесенный XTSвременной ряд (со POSIXctзначениями в качестве типа индекса). Как я могу построить новый временной ряд, выбранный, скажем, с 10-минутным интервалом, но с каждым моментом выборки, выровненным по времени раунда (13:00:00, 13:10:00, 13:20:00, ...) , Если момент...

9
Каковы практические и интерпретационные различия между альтернативами и логистической регрессией?

Недавний вопрос об альтернативах логистической регрессии в R дал множество ответов, включая randomForest, gbm, rpart, bayesglm и обобщенные аддитивные модели. Каковы практические и интерпретационные различия между этими методами и логистической регрессией? Какие предположения они делают (или не...

9
R: обновить график динамически [закрыто]

Закрыто. Этот вопрос не по теме . В настоящее время он не принимает ответы. Хотите улучшить этот вопрос? Обновите вопрос, чтобы он соответствовал теме перекрестной проверки. Закрыто 8 месяцев назад . Это вопрос визуализации данных. У меня есть база данных, которая содержит некоторые данные,...

9
Использование разложения по сингулярным значениям для вычисления ковариационной матрицы дисперсии из модели линейной регрессии

У меня есть матрица расчета p-регрессоров, n наблюдений, и я пытаюсь вычислить выборочную матрицу дисперсии-ковариации параметров. Я пытаюсь напрямую рассчитать его с помощью SVD. Я использую R, когда я беру svd матрицы проектирования, я получаю три компонента: матрицу которая является n × p ,...

9
Как тест Tukey HSD может быть более значимым, чем нескорректированное значение P t.test?

Я пришел к сообщению « Последующие парные сравнения двухстороннего ANOVA » (отвечая на этот пост ), где показано следующее: dataTwoWayComparisons <- read.csv("http://www.dailyi.org/blogFiles/RTutorialSeries/dataset_ANOVA_TwoWayComparisons.csv") model1 <- aov(StressReduction~Treatment+Age,...

9
Как я могу ускорить расчет фиксированных эффектов в GLMM?

Я занимаюсь имитационным исследованием, которое требует начальной загрузки оценок, полученных из обобщенной линейной смешанной модели (на самом деле, это произведение двух оценок для фиксированных эффектов, одна из GLMM и одна из LMM). Чтобы хорошо провести исследование, потребовалось бы около 1000...

9
Переменная кода в функции nlm ()

В R есть функция nlm (), которая выполняет минимизацию функции f с помощью алгоритма Ньютона-Рафсона. В частности, эта функция выводит значение кода переменной, определенного следующим образом: закодируйте целое число, указывающее, почему процесс оптимизации завершился. 1: относительный градиент...

9
Как рассчитать показатели центральности в 4-миллионной пограничной сети, используя R?

У меня есть файл CSV с 4 миллионами ребер направленной сети, представляющих людей, общающихся друг с другом (например, Джон отправляет сообщение Мэри, Мэри отправляет сообщение Энн, Джон отправляет другое сообщение Мэри и т. Д.). Я хотел бы сделать две вещи: Найти степень, между и (возможно)...

9
Как искать статистическую процедуру в R?

Есть ли пакет R, веб-сайт или команда, которая позволит искать конкретную статистическую процедуру, которую они хотят? Например, если я хочу найти пакет с преобразованием Бокса-Кокса, веб-сайт / пакет / команда может вернуть «MASS» и отослать меня к boxcox()функции. Это довольно просто с чем-то...

9
Эффект границы в вейвлет-анализе с множественным разрешением

Каковы методы минимизации влияния границ при вейвлет-разложении? Я использую R и пакет waveslim . Я нашел, например, функцию ?brick.wall но Я не слишком использую, как использовать это. Я не уверен, что лучшим решением будет удалить какой-то коэффициент. Я где-то читал, что существуют некоторые...

9
Правильно ли я указываю свою модель lmer?

Я искал Google и этот сайт, и я все еще не понимаю функцию lmer в библиотеке lme4. У меня есть некоторые данные, собранные в разных психиатрических отделениях, которые имеют многоуровневую структуру. Для упрощения я выберу две переменные уровня 2 и две переменные уровня 1, хотя на самом деле у меня...