Вопросы с тегом «r»

16
Что здесь происходит, когда я использую квадрат потерь в настройке логистической регрессии?

Я пытаюсь использовать квадратичные потери, чтобы выполнить двоичную классификацию для набора данных игрушек. Я использую mtcarsнабор данных, использую милю на галлон и вес, чтобы предсказать тип передачи. На приведенном ниже графике показаны два типа данных типа передачи в разных цветах и...

16
Как байесовская статистика справляется с отсутствием приоров?

Этот вопрос был вдохновлен двумя недавними взаимодействиями, которые у меня были: одно здесь, в резюме , другое на economics.se. Там, я отправил ответ на известный «Конверт парадокса» (заметьте, не как на «правильный ответ» , но в качестве ответа , вытекающих из конкретных предположений о структуре...

16
Что это означает, что AUC является полусобственным правилом подсчета очков?

Правильное правило подсчета очков - это правило, которое максимизируется «истинной» моделью, и оно не позволяет «хеджировать» или разыгрывать систему (преднамеренно сообщая о различных результатах, как и истинное убеждение модели в улучшении оценки). Оценка Бриера правильная, точность (пропорция...

15
Почему школы США и Великобритании обучают различным методам расчета стандартного отклонения?

Как я понимаю, в школах Великобритании учат, что стандартное отклонение определяется с использованием: в то время как школы США преподают: (на базовом уровне в любом случае). В прошлом это вызывало проблемы у моих студентов, которые искали в Интернете, но нашли неверное объяснение. Почему разница?...

15
Усадка Джеймса-Стейна «в дикой природе»?

Я согласен с идеей сжатия Джеймса-Стейна (то есть, что нелинейная функция одного наблюдения вектора возможно независимых нормалей может быть лучшей оценкой средних значений случайных величин, где «лучше» измеряется квадратической ошибкой). ). Однако я никогда не видел его в прикладной работе. Я...

15
Хороший способ показать много данных в графическом виде

Я работаю над проектом, который включает 14 переменных и 345 000 наблюдений для данных о жилье (такие как год постройки, квадратные метры, проданная цена, округ проживания и т. Д.). Меня интересует попытка найти хорошие графические методы и библиотеки R, которые содержат хорошие методы построения...

15
Сравнение моделей со смешанным эффектом с одинаковым количеством степеней свободы

У меня есть эксперимент, который я постараюсь изложить здесь. Представьте, что я бросаю перед вами три белых камня и прошу вас высказать свое мнение об их положении. Я записываю различные свойства камней и ваш ответ. Я делаю это по ряду предметов. Я генерирую две модели. Во-первых, ближайший к вам...

15
Случайные числа и многоядерный пакет

При программировании на R я использовал многоядерный пакет несколько раз. Тем не менее, я никогда не видел заявления о том, как он обрабатывает случайные числа. Когда я использую openMP с C, я осторожно использую правильный параллельный RNG, но с R я предполагаю, что происходит что-то разумное....

15
Учебники по объектно-ориентированному программированию в R [закрыто]

Закрыто. Этот вопрос не по теме . В настоящее время он не принимает ответы. Закрыто 4 года назад . Locked . Этот вопрос и его ответы заблокированы, потому что вопрос не по теме, но имеет историческое значение. В настоящее время он не принимает новые ответы или взаимодействия. Есть ли хорошие...

15
Доверительные интервалы для параметров регрессии: байесовский или классический

Учитывая два массива x и y длиной n, я подгоняю модель y = a + b * x и хочу рассчитать 95% доверительный интервал для наклона. Это (b - дельта, b + дельта), где b находится обычным образом и delta = qt(0.975,df=n-2)*se.slope и se.slope - стандартная ошибка на склоне. Один из способов получить...

15
Хорошее введение во временные ряды (с R)

В настоящее время я собираю данные для эксперимента по психосоциальным характеристикам, связанным с переживанием боли. Как часть этого, я собираю измерения GSR и BP в электронном виде от моих участников, наряду с различными самоотчётами и скрытыми измерениями. У меня психологический фон, и я...

15
Как оптимизировать мой R скрипт для использования «многоядерности»

Я использую GNU R на ПК с Ubuntu-Lucid, который имеет 4 процессора. Чтобы использовать все 4 процессора, я установил пакет «r-cran-multicore». Поскольку в руководстве по пакету отсутствуют практические примеры, которые я понимаю, мне нужен совет, как оптимизировать мой сценарий, чтобы использовать...

15
Что хорошего хорошего распределения степеней свободы в распределении?

Я хочу использовать при распределении для моделирования доходности активов с коротким интервалом в байесовской модели. Я хотел бы оценить обе степени свободы (наряду с другими параметрами в моей модели) для распределения. Я знаю, что доходность активов совершенно ненормальная, но я не знаю слишком...

15
Как агрегировать по минутам данные за неделю в почасовые средства?

Как бы вы получили почасовые средние значения для нескольких столбцов данных за ежедневный период и показывали результаты для двенадцати "хостов" на одном графике? То есть я хотел бы наметить, как выглядит 24-часовой период для данных за недели. Конечной целью будет сравнение двух наборов этих...

15
Понимание запаздывания в расширенном тесте Дики Фуллера R

Я поигрался с некоторым модульным тестированием корня в R, и я не совсем уверен, что делать с параметром k lag. Я использовал дополненной тест Дики Фуллера и тест Филиппс Перрона из tseries пакета. Очевидно, что параметр по умолчанию (для ) зависит только от длины ряда. Если я выберу разные...

15
Как построить эллипс из собственных значений и собственных векторов в R? [закрыто]

Закрыто. Этот вопрос не по теме . В настоящее время он не принимает ответы. Хотите улучшить этот вопрос? Обновите вопрос, чтобы он соответствовал теме перекрестной проверки. Закрыто 2 года назад . Может ли кто-нибудь придумать R- код для построения эллипса из собственных значений и собственных...

15
Эффективное обновление линейной регрессии при добавлении наблюдений и / или предикторов в R

Мне было бы интересно найти пути в R для эффективного обновления линейной модели при добавлении наблюдения или предиктора. У biglm есть возможность обновления при добавлении наблюдений, но мои данные достаточно малы, чтобы находиться в памяти (хотя у меня есть большое количество экземпляров для...

15
Как настроить и интерпретировать контрасты ANOVA с пакетом автомобилей в R?

Допустим, у меня есть простой факторный эксперимент 2x2, на котором я хочу провести ANOVA. Вот так, например: d <- data.frame(a=factor(sample(c('a1','a2'), 100, rep=T)), b=factor(sample(c('b1','b2'), 100, rep=T))); d$y <- as.numeric(d$a)*rnorm(100, mean=.75, sd=1) + as.numeric(d$b)*rnorm(100,...

15
Площадь под «pdf» в оценке плотности ядра в R

Я пытаюсь использовать функцию плотности в R для оценки плотности ядра. У меня возникли некоторые трудности при интерпретации результатов и сравнении различных наборов данных, так как кажется, что площадь под кривой не обязательно равна 1. Для любой функции плотности вероятности (pdf) нам нужно...