Вопросы с тегом «pandas-groupby»

Используется для группировки переменных по заданному условию. И только для использования в библиотеке `pandas`

439
Получить статистику для каждой группы (например, количество, среднее и т. Д.), Используя pandas GroupBy?

У меня есть фрейм данных, dfи я использую несколько столбцов из него, чтобы groupby: df['col1','col2','col3','col4'].groupby(['col1','col2']).mean() Таким образом, я почти получаю таблицу (фрейм данных), которая мне нужна. Чего не хватает, так это дополнительного столбца, который содержит...

359
Как развернуть датафрейм

Что такое пивот? Как мне повернуть? Это стержень? Длинный формат для широкого формата? Я видел много вопросов о сводных таблицах. Даже если они не знают, что спрашивают о сводных таблицах, они обычно так и делают. Практически невозможно написать канонический вопрос и ответ, который охватывает все...

274
Как сгруппировать строки данных в список в pandas groupby?

У меня есть фрейма данных панд, dfкак: a b A 1 A 2 B 5 B 5 B 4 C 6 Я хочу сгруппировать по первому столбцу и получить второй столбец в виде списков в строках : A [1,2] B [5,5,4] C [6] Можно ли сделать что-то подобное с помощью групповых...

245
Получить ряд (ы), которые имеют максимальное количество в группах, используя групповой

Как найти все строки в кадре данных pandas, которые имеют максимальное значение для countстолбца, после группировки по ['Sp','Mt']столбцам? Пример 1: следующий dataFrame, который я группирую по ['Sp','Mt']: Sp Mt Value count 0 MM1 S1 a **3** 1 MM1 S1 n 2 2 MM1 S3 cb 5 3 MM2 S3 mk **8** 4 MM2 S4 bg...

162
столбцы pandas GroupBy со значениями NaN (отсутствующими)

У меня есть DataFrame со многими пропущенными значениями в столбцах, которые я хочу сгруппировать: import pandas as pd import numpy as np df = pd.DataFrame({'a': ['1', '2', '3'], 'b': ['4', np.NaN, '6']}) In [4]: df.groupby('b').groups Out[4]: {'4': [0], '6': [2]} видите, что Pandas сбросил строки...

154
Как получить доступ к pandas groupby dataframe по ключу

Как получить доступ к соответствующему фрейму данных groupby в объекте groupby по ключу? Со следующей группой: rand = np.random.RandomState(1) df = pd.DataFrame({'A': ['foo', 'bar'] * 3, 'B': rand.randn(6), 'C': rand.randint(0, 20, 6)}) gb = df.groupby(['A']) Я могу пройти через это, чтобы получить...

129
Несколько агрегаций одного и того же столбца с использованием pandas GroupBy.agg ()

Есть ли встроенный в pandas способ применения двух разных агрегатных функций f1, f2к одному и тому же столбцу df["returns"]без необходимости вызывать agg()несколько раз? Пример фрейма данных: import pandas as pd import datetime as dt pd.np.random.seed(0) df = pd.DataFrame({ "date" : [dt.date(2012,...

99
GroupBy pandas DataFrame и выберите наиболее распространенное значение

У меня есть фрейм данных с тремя строковыми столбцами. Я знаю, что единственное значение в 3-м столбце действительно для каждой комбинации первых двух. Чтобы очистить данные, мне нужно сгруппировать данные по фреймам по первым двум столбцам и выбрать наиболее распространенное значение третьего...

88
Панды: заполнение пропущенных значений средним в каждой группе

Это должно быть просто, но самое близкое, что я нашел, это этот пост: pandas: Заполнение недостающих значений внутри группы , и я все еще не могу решить свою проблему .... Предположим, у меня есть следующий фрейм данных df = pd.DataFrame({'value': [1, np.nan, np.nan, 2, 3, 1, 3, np.nan, 3],...

84
Как мне создать новый столбец из вывода pandas groupby (). Sum ()?

Попытка создать новый столбец из groupbyрасчета. В приведенном ниже коде я получаю правильные рассчитанные значения для каждой даты (см. Группу ниже), но когда я пытаюсь создать с ним новый столбец ( df['Data4']), я получаю NaN. Итак, я пытаюсь создать новый столбец в фрейме данных с суммой...

9
Как найти верхние N минимальных значений из DataFrame, Python-3

У меня ниже Dataframe с полем «Возраст», необходимо найти до 3-х минимальный возраст из DataFrame DF = pd.DataFrame.from_dict({'Name':['A', 'B', 'C', 'D', 'E', 'F', 'G', 'H', 'I', 'J'], 'Age':[18, 45, 35, 70, 23, 24, 50, 65, 18, 23]}) DF['Age'].min() Хотите топ два возраста, то есть 18, 23 в...