Вопросы с тегом «pandas»

105
Добавить столбец в фрейм данных pandas

Наверное, это легко, но у меня есть следующие данные: Во фрейме данных 1: index dat1 0 9 1 5 Во фрейме данных 2: index dat2 0 7 1 6 Мне нужен фрейм данных следующей формы: index dat1 dat2 0 9 7 1 5 6 Я пробовал использовать этот appendметод, но получаю перекрестное соединение (т.е. декартово...

104
в блокноте Ipython / Jupyter Pandas не отображает график, который я пытаюсь построить

Я пытаюсь построить некоторые данные с помощью панд в Ipython Notebook, и хотя он дает мне объект, на самом деле он не рисует сам график. Вот так это выглядит: In [7]: pledge.Amount.plot() Out[7]: <matplotlib.axes.AxesSubplot at 0x9397c6c> После этого должен следовать график, но его просто не...

104
Как выбрать строки с NaN в конкретном столбце?

Учитывая этот фрейм данных, как выбрать только те строки, у которых "Col2" равно NaN? In [56]: df = pd.DataFrame([range(3), [0, np.NaN, 0], [0, 0, np.NaN], range(3), range(3)], columns=["Col1", "Col2", "Col3"]) In [57]: df Out[57]: 0 1 2 0 0 1 2 1 0 NaN 0 2 0 0 NaN 3 0 1 2 4 0 1 2 Результат должен...

104
Как «выделить отдельные» в нескольких столбцах фрейма данных в пандах?

Я ищу способ сделать эквивалент SQL SELECT DISTINCT col1, col2 FROM dataframe_table Сравнение pandas sql ни о чем не говорит distinct. .unique() работает только для одного столбца, поэтому я полагаю, что могу объединить столбцы или поместить их в список / кортеж и сравнить таким образом, но...

104
Как получить значение из Pandas DataFrame, а не индекс и тип объекта

Скажем, у меня есть следующий DataFrame Буквенный номер А 1 БИ 2 C 3 D 4 Что можно получить с помощью следующего кода import pandas as pd letters=pd.Series(('A', 'B', 'C', 'D')) numbers=pd.Series((1, 2, 3, 4)) keys=('Letters', 'Numbers') df=pd.concat((letters, numbers), axis=1, keys=keys) Теперь я...

104
Понимание на месте = Истина

В pandasбиблиотеке много раз есть возможность изменить объект на месте, например, с помощью следующего оператора ... df.dropna(axis='index', how='all', inplace=True) Мне любопытно, что возвращается, а также как обрабатывается объект, когда inplace=Trueон передается или когда inplace=False. Все ли...

104
построить разные цвета для разных категорийных уровней, используя matplotlib

У меня есть этот фрейм данных, diamondsкоторый состоит из таких переменных, как (carat, price, color), и я хочу нарисовать диаграмму рассеяния от priceдо caratдля каждой color, что означает, что разные colorимеют разные цвета на графике. Это легко сделать Rс ggplot: ggplot(aes(x=carat, y=price,...

104
Могут ли Панды построить гистограмму дат?

Я взял свою серию и привел ее к столбцу datetime dtype = datetime64[ns](хотя требуется только дневное разрешение ... не знаю, как это изменить). import pandas as pd df = pd.read_csv('somefile.csv') column = df['date'] column = pd.to_datetime(column, coerce=True) но построение графика не работает:...

103
Объект DataFrame не имеет атрибута sort

У меня здесь проблема, в моем пакете python я установил numpy, но у меня все еще есть эта ошибка Объект DataFrame не имеет атрибута sort Кто угодно может дать мне представление .. Это мой код: final.loc[-1] =['', 'P','Actual'] final.index = final.index + 1 # shifting index final = final.sort()...

103
Импортировать столбец фрейма данных pandas как строку, а не int

Я хотел бы импортировать следующий csv как строки, а не как int64. Pandas read_csv автоматически преобразует его в int64, но мне нужен этот столбец как строка. ID 00013007854817840016671868 00013007854817840016749251 00013007854817840016754630 00013007854817840016781876 00013007854817840017028824...

103
Почему установка Pandas на Alpine Linux занимает много времени

Я заметил, что установка Pandas и Numpy (это зависимость) в контейнере Docker с использованием базовой ОС Alpine по сравнению с CentOS или Debian занимает гораздо больше времени. Ниже я создал небольшой тест, чтобы продемонстрировать разницу во времени. Помимо нескольких секунд, которые требуется...

103
Как заменить текст в столбце фрейма данных Pandas?

У меня есть столбец в моем фрейме данных: range "(2,30)" "(50,290)" "(400,1000)" ... и я хочу заменить ,запятую -тире. Сейчас я использую этот метод, но ничего не изменилось. org_info_exc['range'].replace(',', '-', inplace=True) Кто-нибудь может помочь?...

103
как вы фильтруете фреймы данных pandas по нескольким столбцам

Чтобы отфильтровать фрейм данных (df) по одному столбцу, если мы рассмотрим данные с мужчинами и женщинами, мы могли бы: males = df[df[Gender]=='Male'] Вопрос 1. Но что, если данные охватывают несколько лет, и я хотел бы видеть только мужчин за 2014 год? На других языках я мог бы сделать...

103
Преобразование категориальных данных в фреймворк pandas

У меня есть фрейм данных с этим типом данных (слишком много столбцов): col1 int64 col2 int64 col3 category col4 category col5 category Столбцы выглядят так: Name: col3, dtype: category Categories (8, object): [B, C, E, G, H, N, S, W] Я хочу преобразовать все значения в столбцах в целые числа...

102
удаление строк из фрейма данных на основании условия «не в» [дубликат]

На этот вопрос уже есть ответы здесь : Как отфильтровать фрейм данных Pandas, используя 'in' и 'not in', как в SQL (8 ответов) Закрыт 6 месяцев назад . Я хочу удалить строки из фрейма данных pandas, когда значение столбца даты находится в списке дат. Следующий код не работает: a=['2015-01-01' ,...

102
Эффективно ли проверять, является ли произвольный объект NaN в Python / numpy / pandas?

Мои массивы numpy используют np.nanдля обозначения отсутствующих значений. Когда я перебираю набор данных, мне нужно обнаруживать такие отсутствующие значения и обрабатывать их особым образом. Я наивно использовал numpy.isnan(val), который работает хорошо, если только valон не входит в...