Вопросы с тегом «pandas»

10
Преобразовать несколько категориальных столбцов

В моем наборе данных у меня есть два категориальных столбца, которые я хотел бы перечислить. Оба столбца содержат страны, некоторые перекрываются (отображаются в обоих столбцах). Я хотел бы дать одно и то же число в столбцах 1 и 2 для одной и той же страны. Мои данные выглядят примерно так: import...

10
Pandas: зигзагообразная сегментация данных на основе локальных минимумов-максимумов

У меня есть данные временных рядов. Генерация данных date_rng = pd.date_range('2019-01-01', freq='s', periods=400) df = pd.DataFrame(np.random.lognormal(.005, .5,size=(len(date_rng), 3)), columns=['data1', 'data2', 'data3'], index= date_rng) s = df['data1'] Я хочу создать зигзагообразную линию,...

10
Фильтрация DataFrame по группам, где количество элементов отличается от 1

Я работаю с DataFrame, имеющим следующую структуру: import pandas as pd df = pd.DataFrame({'group':[1,1,1,2,2,2,2,3,3,3], 'brand':['A','B','X','C','D','X','X','E','F','X']}) print(df) group brand 0 1 A 1 1 B 2 1 X 3 2 C 4 2 D 5 2 X 6 2 X 7 3 E 8 3 F 9 3 X Моя цель состоит в том, чтобы просмотреть...

9
dtypes портят вещи при перемещении по первой оси (столбцы)

Рассмотрим кадр данных df df = pd.DataFrame(dict(A=[1, 2], B=['X', 'Y'])) df A B 0 1 X 1 2 Y Если я смещусь axis=0(по умолчанию) df.shift() A B 0 NaN NaN 1 1.0 X Это толкает все ряды вниз на один ряд, как и ожидалось. Но когда я сдвигаюсь axis=1 df.shift(axis=1) A B 0 NaN NaN 1 NaN NaN Все ноль,...

9
объединить два кадра данных и добавить уровень столбца с именами

Привет! Я копался в методах concat, join и merge для панд и не могу найти то, что мне нужно. Предположим, у меня есть два кадра данных A = pd.DataFrame("A",index=[0,1,2,3,4],columns=['Col 1','Col 2','Col 3']) B = pd.DataFrame("B",index=[0,1,2,3,4],columns=['Col 1','Col 2','Col 3']) >>> A...

9
Переместите каждую вторую строку в строку выше в панде.

У меня есть датафрейм в этой форме: A B C D E 213-1 XL NaN NaN NaN 21 22.0 12 232.0 101.32 23-0 L NaN NaN NaN 12 23 12 232.2 NaN 31-0 LS NaN NaN NaN 70 70 23 NaN 21.22 Я хотел бы переместить каждую вторую строку этого кадра данных в строку выше, чтобы остались только объединенные строки, как видно...

9
Как найти верхние N минимальных значений из DataFrame, Python-3

У меня ниже Dataframe с полем «Возраст», необходимо найти до 3-х минимальный возраст из DataFrame DF = pd.DataFrame.from_dict({'Name':['A', 'B', 'C', 'D', 'E', 'F', 'G', 'H', 'I', 'J'], 'Age':[18, 45, 35, 70, 23, 24, 50, 65, 18, 23]}) DF['Age'].min() Хотите топ два возраста, то есть 18, 23 в...

9
Установщик свойств для подкласса Pandas DataFrame

Я пытаюсь настроить подкласс, pd.DataFrameкоторый имеет два обязательных аргумента при инициализации ( groupи timestamp_col). Я хочу запустить проверку этих аргументов groupи timestamp_col, таким образом, у меня есть метод установки для каждого из свойств. Это все работает, пока я не попытаюсь...

9
AttributeError: у объекта «DataFrame» нет атрибута «ix»

Я получаю сообщение об ошибке выше, когда пытаюсь использовать атрибут .ix для pandas dataframe, чтобы извлечь столбец, например, df.ix [:, 'col_header']. Сценарий работал с утра, но сегодня днем ​​я запустил его в новой среде Linux с новой установкой Pandas. Кто-нибудь еще видел эту ошибку раньше?...

9
Применение функции Python к сгруппированной в DataFrame группе Pandas - какой наиболее эффективный подход для ускорения вычислений?

Я имею дело с довольно большим Pandas DataFrame - мой набор данных похож на следующую dfнастройку: import pandas as pd import numpy as np #--------------------------------------------- SIZING PARAMETERS : R1 = 20 # .repeat( repeats = R1 ) R2 = 10 # .repeat( repeats = R2 ) R3 = 541680 # .repeat(...