Вопросы с тегом «r»

9
Как формализовать предыдущее распределение вероятностей? Есть ли практические правила или советы, которые следует использовать?

Хотя мне нравится думать, что я хорошо понимаю концепцию предварительной информации в байесовском статистическом анализе и принятии решений, у меня часто возникают проблемы с нахождением головы вокруг ее применения. Я имею в виду пару ситуаций, которые иллюстрируют мою борьбу, и я чувствую, что они...

9
В чем разница между этими двумя тестами Бреуша-язычества?

Используя R на некоторых данных и пытаясь определить , являются ли мои данные гетероскедастичными, я нашел две реализации теста Бреуша -Пагана: bptest (package lmtest) и ncvTest (package car). Однако они дают разные результаты. Какая разница между двумя? Когда вы должны использовать один или...

9
Присвоение большего веса более поздним наблюдениям регрессии

Как мне придать больший вес более поздним наблюдениям в R? Я предполагаю, что это часто задаваемый вопрос или желание, но мне трудно понять, как именно это реализовать. Я пытался много искать для этого, но я не могу найти хороший практический пример. В моем примере у меня будет большой набор данных...

9
Сила леди, дегустирующая чайный эксперимент

В известном эксперименте Фишера наблюдаемый является количеством скорректированного отгаданнога чашки имеющим два виду чашки и . Обычно интересно вычислить критическую область, чтобы отвергнуть нулевую гипотезу (дама случайным образом угадывает), учитывая размер теста . Это легко сделать с помощью...

9
Как улучшить время выполнения для импутации данных R MICE

Мой вопрос вкратце: есть ли способы улучшить время работы R MICE (вменение данных)? Я работаю с набором данных (30 переменных, 1,3 миллиона строк), который содержит (совершенно случайно) недостающие данные. Около 8% наблюдений примерно в 15 из 30 переменных содержат НК. Чтобы вложить недостающие...

9
Определение весов наименьших квадратов: функция R lm против

Может кто-нибудь сказать мне, почему я получаю разные результаты от Rвзвешенных наименьших квадратов и ручного решения с помощью матричной операции ? В частности, я пытаюсь вручную решить , где - диагональная матрица весов, - матрица данных, - ответ вектор. W A bWAx=WbWAx=Wb\mathbf W \mathbf...

9
Как рассчитать доверительный интервал X-перехвата в линейной регрессии?

Поскольку стандартная ошибка линейной регрессии обычно задается для переменной отклика, мне интересно, как получить доверительные интервалы в другом направлении - например, для x-перехвата. Я могу представить, что это может быть, но я уверен, что должен быть прямой способ сделать это. Ниже приведен...

9
Разрешено ли использовать средние значения для набора данных для улучшения корреляции?

У меня есть набор данных с зависимой и независимой переменной. Оба не временные ряды. У меня 120 наблюдений. Коэффициент корреляции составляет 0,43. После этого расчета я добавил столбец для обеих переменных со средним значением для каждых 12 наблюдений, в результате чего появилось 2 новых столбца...

9
Линейная модель, где данные имеют неопределенность, используя R

Допустим, у меня есть данные, которые имеют некоторую неопределенность. Например: X Y 1 10±4 2 50±3 3 80±7 4 105±1 5 120±9 Природой неопределенности могут быть, например, повторные измерения или эксперименты, или неопределенность измерительного прибора. Я хотел бы подогнать к нему кривую, используя...

9
Разница между типами СВМ

Я новичок в поддержке векторных машин. Краткое объяснение svmФункция из e1071пакета в R предлагает различные варианты: C-классификация ню-классификации одна классификация (для обнаружения новизны) EPS-регрессионный ню-регрессионный Каковы интуитивные различия между пятью типами? Какой из них...

9
Почему мои модели VAR работают лучше с нестационарными данными, чем со стационарными данными?

Я использую библиотеку python statsmodels VAR для моделирования данных финансовых временных рядов, и некоторые результаты меня озадачили. Я знаю, что модели VAR предполагают, что данные временного ряда являются стационарными. Я непреднамеренно подбираю нестационарную серию журнальных цен для двух...

9
Каковы последствия наличия непостоянной дисперсии в терминах ошибки в линейной регрессии?

Одно из предположений о линейной регрессии состоит в том, что должна быть постоянная дисперсия в терминах ошибок и что доверительные интервалы и проверки гипотез, связанные с моделью, основаны на этом предположении. Что именно происходит, когда члены ошибки не имеют постоянной...

9
Модель смешанных эффектов со сплайнами

Я подгоняю модель со смешанными эффектами сплайн-термином в приложении, где известно, что тренд во времени является криволинейным. Тем не менее, я хотел бы оценить, происходит ли криволинейный тренд из-за индивидуального отклонения от линейности, или это эффект на уровне группы, который делает...

9
Многомерная линейная регрессия с лассо по r

Я пытаюсь создать сокращенную модель для прогнозирования многих зависимых переменных (DV) (~ 450), которые сильно коррелированы. Мои независимые переменные (IV) также многочисленны (~ 2000) и сильно коррелированы. Если я использую лассо, чтобы выбрать сокращенную модель для каждого выходного...

9
Небольшое несоответствие между встроенной функцией R Крускала-Уоллиса и ручным расчетом

Меня смущает следующее, и я не смог найти ответ в другом месте. Я пытаюсь изучить R, выполняя некоторую статистику, и, в качестве упражнения, я пытаюсь перепроверить результаты встроенных функций R, также делая их «вручную», как это было в R. Однако , для теста Крускала-Уоллиса я продолжаю получать...

9
Имитация линейной регрессии с гетероскедастичностью

Я пытаюсь смоделировать набор данных, который соответствует имеющимся у меня эмпирическим данным, но я не уверен, как оценить ошибки в исходных данных. Эмпирические данные включают гетероскедастичность, но я не заинтересован в ее преобразовании, а скорее использую линейную модель с ошибочным...

9
Генерация случайных чисел из «наклонного равномерного распределения» из математической теории

Для каких-то целей мне нужно генерировать случайные числа (данные) из распределения "наклонной формы". «Наклон» этого распределения может изменяться в некотором разумном интервале, и тогда мое распределение должно измениться с равномерного на треугольное в зависимости от наклона. Вот мой вывод:...

9
Почему я не могу получить действительный SVD X через разложение по собственным значениям XX 'и X'X?

Я пытаюсь сделать SVD вручную: m<-matrix(c(1,0,1,2,1,1,1,0,0),byrow=TRUE,nrow=3) U=eigen(m%*%t(m))$vector V=eigen(t(m)%*%m)$vector D=sqrt(diag(eigen(m%*%t(m))$values)) U1=svd(m)$u V1=svd(m)$v D1=diag(svd(m)$d) U1%*%D1%*%t(V1) U%*%D%*%t(V) Но последняя строка не возвращается mобратно. Почему?...

9
Ниже, чем ожидалось, охват для важности выборки с моделированием

Я пытался ответить на вопрос Оценка интеграла Важность метода отбора проб в R . В основном, пользователь должен рассчитать ∫π0f(x)dx=∫π01cos(x)2+x2dx∫0πf(x)dx=∫0π1cos⁡(x)2+x2dx\int_{0}^{\pi}f(x)dx=\int_{0}^{\pi}\frac{1}{\cos(x)^2+x^2}dx используя экспоненциальное распределение в качестве...

9
Как мне интерпретировать кривую выживания модели риска Кокса?

Как вы интерпретируете кривую выживания из модели пропорционального риска Кокса? В этом игрушечном примере предположим, что у нас есть модель пропорционального риска Кокса для ageпеременной в kidneyданных, и сгенерируем кривую выживания. library(survival) fit <- coxph(Surv(time, status)~age,...