Вопросы с тегом «aggregation»

Относится к "объединению" потенциально неоднородных групп данных.

20
Каковы правильные значения для точности и отзыва в крайних случаях?

Точность определяется как: p = true positives / (true positives + false positives) Является ли это исправить , что, как true positivesи false positivesподход 0, точность приближается к 1? Тот же вопрос для отзыва: r = true positives / (true positives + false negatives) В настоящее время я выполняю...

15
Как агрегировать по минутам данные за неделю в почасовые средства?

Как бы вы получили почасовые средние значения для нескольких столбцов данных за ежедневный период и показывали результаты для двенадцати "хостов" на одном графике? То есть я хотел бы наметить, как выглядит 24-часовой период для данных за недели. Конечной целью будет сравнение двух наборов этих...

14
Быстрые способы в R получить первую строку фрейма данных, сгруппированного по идентификатору [закрыто]

Закрыто. Этот вопрос не по теме . В настоящее время он не принимает ответы. Хотите улучшить этот вопрос? Обновите вопрос, чтобы он соответствовал теме перекрестной проверки. Закрыто 2 года назад . Иногда мне нужно получить только первую строку набора данных, сгруппированную по идентификатору, как...

13
LARS против координатного спуска для лассо

Каковы плюсы и минусы использования LARS [1] по сравнению с использованием координатного спуска для подбора L1-регуляризованной линейной регрессии? Я в основном заинтересован в аспектах производительности (мои проблемы, как правило, Nисчисляются сотнями тысяч и p<20). Однако, любые другие идеи...

13
Как вы выбираете единицу анализа (уровень агрегации) во временном ряду?

Если вы можете измерить временной ряд наблюдений с любым уровнем точности во времени, и ваша цель исследования состоит в том, чтобы определить связь между X и Y, есть ли какое-либо эмпирическое обоснование для выбора определенного уровня агрегации по сравнению с другим, или следует выбор будет...

13
Квантили из комбинации нормальных распределений

У меня есть информация о распределении антропометрических размеров (таких как размах плеч) для детей разных возрастов. Для каждого возраста и измерения у меня есть среднее стандартное отклонение. (У меня также есть восемь квантилей, но я не думаю, что смогу получить от них то, что хочу.) Для...

12
Какая статистика сохраняется при агрегировании?

Если у нас есть длинные временные ряды с высоким разрешением и большим количеством шума, часто имеет смысл объединять данные в более низкое разрешение (скажем, ежедневные или ежемесячные значения), чтобы лучше понять, что происходит, эффективно удаляя некоторые из шум. Я видел по крайней мере одну...

11
Как найти сводную статистику для всех уникальных комбинаций факторов в data.frame в R? [закрыто]

Закрыто. Этот вопрос не по теме . В настоящее время он не принимает ответы. Хотите улучшить этот вопрос? Обновите вопрос, чтобы он соответствовал теме перекрестной проверки. Закрыто 2 года назад . Я хочу рассчитать сводку переменной в data.frame для каждой уникальной комбинации факторов в...

11
Должен ли я проводить отдельные регрессии для каждого сообщества или сообщество может быть просто управляющей переменной в агрегированной модели?

Я использую модель OLS с непрерывной переменной индекса ресурса в качестве DV. Мои данные собраны из трех аналогичных сообществ в географической близости друг к другу. Несмотря на это, я подумал, что важно использовать сообщество в качестве управляющей переменной. Как оказалось, сообщество значимо...

10
Случайный лесной вероятностный прогноз против большинства голосов

Кажется, Scikit Learn использует вероятностный прогноз вместо большинства голосов за метод агрегации моделей без объяснения причин (1.9.2.1. Случайные леса). Есть четкое объяснение почему? Кроме того, есть ли хорошая статья или обзорная статья о различных методах агрегации моделей, которые можно...

9
Рассчитать кривую ROC для данных

Итак, у меня есть 16 испытаний, в которых я пытаюсь идентифицировать человека по биометрической характеристике, используя расстояние Хэмминга. Мой порог установлен на 3,5. Мои данные ниже, и только пробная версия 1 является истинным положительным результатом: Trial Hamming Distance 1 0.34 2 0.37 3...