Вопросы с тегом «aggregate»

Агрегат - это процесс обобщения сгруппированных данных, обычно используемый в статистике.

357
Как суммировать переменную по группе

У меня есть фрейм данных с двумя столбцами. Первый столбец содержит категории, такие как «Первый», «Второй», «Третий», а второй столбец содержит числа, которые представляют количество раз, когда я видел определенные группы из «Категории». Например: Category Frequency First 10 First 15 First 5...

274
Как сгруппировать строки данных в список в pandas groupby?

У меня есть фрейма данных панд, dfкак: a b A 1 A 2 B 5 B 5 B 4 C 6 Я хочу сгруппировать по первому столбцу и получить второй столбец в виде списков в строках : A [1,2] B [5,5,4] C [6] Можно ли сделать что-то подобное с помощью групповых...

154
Агрегировать / суммировать несколько переменных на группу (например, сумма, среднее)

Из кадра данных, есть простой способ агрегации ( sum, mean, maxодновременно с) и др несколько переменных? Ниже приведены некоторые примеры данных: library(lubridate) days = 365*2 date = seq(as.Date("2000-01-01"), length = days, by = "day") year = year(date) month = month(date) x1 =...

129
Несколько агрегаций одного и того же столбца с использованием pandas GroupBy.agg ()

Есть ли встроенный в pandas способ применения двух разных агрегатных функций f1, f2к одному и тому же столбцу df["returns"]без необходимости вызывать agg()несколько раз? Пример фрейма данных: import pandas as pd import datetime as dt pd.np.random.seed(0) df = pd.DataFrame({ "date" : [dt.date(2012,...

121
Подсчитайте количество строк в каждой группе

У меня есть фрейм данных, и я хотел бы подсчитать количество строк в каждой группе. Я регулярно использую эту aggregateфункцию для суммирования данных следующим образом: df2 <- aggregate(x ~ Year + Month, data = df1, sum) Теперь я хотел бы посчитать наблюдения, но не могу найти подходящего...

92
Применение нескольких сводных функций к нескольким переменным по группам за один вызов

У меня есть следующий фрейм данных x <- read.table(text = " id1 id2 val1 val2 1 a x 1 9 2 a x 2 4 3 a y 3 5 4 a y 4 9 5 b x 1 7 6 b y 4 4 7 b x 3 9 8 b y 2 8", header = TRUE) Я хочу вычислить среднее значение val1 и val2, сгруппированных по id1 и id2, и одновременно подсчитать количество строк...

88
Панды суммируются по группам, но исключают определенные столбцы

Каков наилучший способ сделать groupby в кадре данных Pandas, но исключить некоторые столбцы из этой groupby? например, у меня есть следующий фрейм данных: Code Country Item_Code Item Ele_Code Unit Y1961 Y1962 Y1963 2 Afghanistan 15 Wheat 5312 Ha 10 20 30 2 Afghanistan 25 Maize 5312 Ha 10 20 30 4...

83
Как такие сайты, как kayak.com, собирают контент? [закрыто]

Закрыто . Этот вопрос должен быть более конкретным . В настоящее время он не принимает ответы. Хотите улучшить этот вопрос? Обновите вопрос, чтобы он фокусировался только на одной проблеме, отредактировав этот пост . Закрыт 4 года назад . Уточните этот вопрос Приветствую, я раздумывал над идеей...