Вопросы с тегом «group-by»

99
GroupBy pandas DataFrame и выберите наиболее распространенное значение

У меня есть фрейм данных с тремя строковыми столбцами. Я знаю, что единственное значение в 3-м столбце действительно для каждой комбинации первых двух. Чтобы очистить данные, мне нужно сгруппировать данные по фреймам по первым двум столбцам и выбрать наиболее распространенное значение третьего...

97
MySQL «Группировать по» и «Сортировать по»

Я хочу иметь возможность выбрать группу строк из таблицы электронных писем и сгруппировать их по отправителю. Мой запрос выглядит так: SELECT `timestamp`, `fromEmail`, `subject` FROM `incomingEmails` GROUP BY LOWER(`fromEmail`) ORDER BY `timestamp` DESC Запрос почти работает так, как я хочу - он...

93
Python Pandas: группировать по группам и в среднем?

У меня есть такой фрейм данных: cluster org time 1 a 8 1 a 6 2 h 34 1 c 23 2 d 74 3 w 6 Я хотел бы рассчитать среднее время, затрачиваемое на организацию на кластер. Ожидаемый результат: cluster mean(time) 1 15 ((8+6)/2+23)/2 2 54 (74+34)/2 3 6 Не знаю, как это сделать в Пандах, может кто поможет?...

93
Python: получить счетчик частоты на основе двух столбцов (переменных) в кадре данных pandas в некоторых приложениях строк

Здравствуйте, у меня есть следующий фрейм данных. Group Size Short Small Short Small Moderate Medium Moderate Small Tall Large Я хочу подсчитать, сколько раз одна и та же строка появляется в кадре данных. Group Size Time Short Small 2 Moderate Medium 1 Moderate Small 1 Tall Large 1...

92
Pandas Groupby Диапазон ценностей

Есть ли в пандах простой метод для вызова groupbyдиапазона приращений значений? Например, в приведенном ниже примере я могу разбить и сгруппировать столбец Bс 0.155приращением, чтобы, например, первая пара групп в столбце была Bразделена на диапазоны между '0 - 0,155, 0,155 - 0,31 ... import numpy...

92
Как сгруппировать по неделям в MySQL?

Сервер таблиц Oracle предлагает встроенную функцию TRUNC(timestamp,'DY'). Эта функция преобразует любую метку времени в полночь в предыдущее воскресенье. Как лучше всего это сделать в MySQL? Oracle также предлагает TRUNC(timestamp,'MM')преобразовать метку времени в полночь первого дня месяца, в...

88
Панды суммируются по группам, но исключают определенные столбцы

Каков наилучший способ сделать groupby в кадре данных Pandas, но исключить некоторые столбцы из этой groupby? например, у меня есть следующий фрейм данных: Code Country Item_Code Item Ele_Code Unit Y1961 Y1962 Y1963 2 Afghanistan 15 Wheat 5312 Ha 10 20 30 2 Afghanistan 25 Maize 5312 Ha 10 20 30 4...

86
SQL Server GROUP BY datetime игнорирует час, минуту и ​​выбор со значением даты и суммы

У меня есть таблица с двумя полями - datetimeи int. Я хочу сделать группу datetimeтолько по дате, игнорируя час и минуту. SELECTЗаявление должно возвращать дату , которая отображает на сумму междунара одного дня....

85
Имеет ли значение порядок столбцов в предложении group by?

Если у меня есть два столбца, один с очень высокой мощностью, а другой с очень низкой мощностью (уникальное количество значений), имеет ли значение, в каком порядке я группирую? Вот пример: select dimensionName, dimensionCategory, sum(someFact) from SomeFact f join SomeDim d on f.dimensionKey =...

84
Столбец «недопустим в списке выбора, потому что он не содержится ни в агрегатной функции, ни в предложении GROUP BY»

Я хотел бы отобразить столбец Bв моем нижеприведенном SQL, но когда я добавляю его в запрос, он дает мне следующую ошибку: Столбец T2.B 'недопустим в списке выбора, поскольку он не содержится ни в агрегатной функции, ни в предложении GROUP BY. Мой код: SELECT A, COUNT(B) as T1, B FROM T2 WHERE...

84
Как мне создать новый столбец из вывода pandas groupby (). Sum ()?

Попытка создать новый столбец из groupbyрасчета. В приведенном ниже коде я получаю правильные рассчитанные значения для каждой даты (см. Группу ниже), но когда я пытаюсь создать с ним новый столбец ( df['Data4']), я получаю NaN. Итак, я пытаюсь создать новый столбец в фрейме данных с суммой...

81
Огромная разница в производительности при использовании группировки по сравнению с отдельными

Я провожу несколько тестов на HSQLDBсервере с таблицей, содержащей 500 000 записей. В таблице нет индексов. Существует 5000 различных бизнес-ключей. Мне нужен их список. Естественно, я начал с DISTINCTвопроса: SELECT DISTINCT business_key FROM memory WHERE concept <> 'case' or attrib...