Вопросы с тегом «pandas»

98
Как я могу сделать заголовки столбцов фрейма данных pandas строчными буквами?

Я хочу сделать все заголовки столбцов в нижнем регистре моего фрейма данных pandas пример Если бы у меня был: data = country country isocode year XRAT tcgdp 0 Canada CAN 2001 1.54876 924909.44207 1 Canada CAN 2002 1.56932 957299.91586 2 Canada CAN 2003 1.40105 1016902.00180 .... Я хотел бы...

98
Pandas, выбирающий по метке, иногда возвращает Series, иногда возвращает DataFrame

В Pandas, когда я выбираю метку, которая имеет только одну запись в индексе, я возвращаю серию, но когда я выбираю запись, которая имеет более одной записи, я возвращаю фрейм данных. Почему это? Есть ли способ гарантировать, что я всегда получу фрейм данных? In [1]: import pandas as pd In [2]: df...

98
Преобразование фрейма данных pandas в серию

Я новичок в пандах. У меня есть кадр данных pandas, который составляет 1 строку на 23 столбца. Я хочу преобразовать это в серию? Мне интересно, какой самый питонический способ сделать это? Я пробовал, pd.Series(myResults)но жалуется ValueError: cannot copy sequence with size 23 to array axis with...

98
Как установить ячейку в NaN в кадре данных pandas

Я хотел бы заменить неверные значения в столбце фрейма данных на NaN. mydata = {'x' : [10, 50, 18, 32, 47, 20], 'y' : ['12', '11', 'N/A', '13', '15', 'N/A']} df = pd.DataFrame(mydata) df[df.y == 'N/A']['y'] = np.nan Однако последняя строка не работает и выдает предупреждение, потому что она...

98
Python Pandas - Найдите разницу между двумя фреймами данных

У меня есть два фрейма данных df1 и df2, где df2 - это подмножество df1. Как мне получить новый фрейм данных (df3), который является разницей между двумя фреймами данных? Другими словами, фрейм данных, в котором есть все строки / столбцы в df1, которых нет в df2?...

97
python-pandas и базы данных, такие как mysql

В документации к Pandas есть множество примеров лучших практик работы с данными, хранящимися в различных форматах. Однако я не могу найти хороших примеров для работы, например, с базами данных, такими как MySQL. Может ли кто-нибудь указать мне ссылки или дать несколько фрагментов кода о том, как...

97
Таблица частот для одной переменной

Последний вопрос новичков, панд на день: как мне создать таблицу для одной серии? Например: my_series = pandas.Series([1,2,2,3,3,3]) pandas.magical_frequency_function( my_series ) >> { 1 : 1, 2 : 2, 3 : 3 } Много поисков в Google привело меня к Series.describe () и pandas.crosstabs, но ни...

97
В чем разница между NaN и None?

Я читаю два столбца файла csv, используя pandas, readcsv()а затем присваиваю значения словарю. Столбцы содержат строки цифр и букв. Иногда бывают случаи, когда ячейка пуста. На мой взгляд, значение, считываемое этой словарной статье, должно быть, Noneно вместо этого nanприсваивается. Конечно,...

97
Перечислить самые высокие корреляционные пары из большой корреляционной матрицы в пандах?

Как найти верхние корреляции в корреляционной матрице с Pandas? Есть много ответов о том, как это сделать с R ( Показать корреляции в виде упорядоченного списка, а не в виде большой матрицы или Эффективный способ получить высококоррелированные пары из большого набора данных в Python или R ), но...

97
Как построить два столбца фрейма данных pandas с использованием точек?

У меня есть фрейм данных pandas, и я хотел бы построить значения из одного столбца по сравнению со значениями из другого столбца. К счастью, есть plotметод, связанный с фреймами данных, который, кажется, делает то, что мне нужно: df.plot(x='col_name_1', y='col_name_2') К сожалению, похоже, что...

97
Переместить столбец по имени в начало таблицы в пандах

Вот мой df: Net Upper Lower Mid Zsore Answer option More than once a day 0% 0.22% -0.12% 2 65 Once a day 0% 0.32% -0.19% 3 45 Several times a week 2% 2.45% 1.10% 4 78 Once a week 1% 1.63% -0.40% 6 65 Как мне переместить столбец по имени ( "Mid") в начало таблицы, индекс 0. Вот как должен выглядеть...

97
Python Pandas заменяет NaN в одном столбце значением из соответствующей строки второго столбца

Я работаю с этим фреймом данных Pandas на Python. File heat Farheit Temp_Rating 1 YesQ 75 N/A 1 NoR 115 N/A 1 YesA 63 N/A 1 NoT 83 41 1 NoY 100 80 1 YesZ 56 12 2 YesQ 111 N/A 2 NoR 60 N/A 2 YesA 19 N/A 2 NoT 106 77 2 NoY 45 21 2 YesZ 40 54 3 YesQ 84 N/A 3 NoR 67 N/A 3 YesA 94 N/A 3 NoT 68 39 3 NoY...

97
В чем разница между pandas.qcut и pandas.cut?

В документации говорится: http://pandas.pydata.org/pandas-docs/dev/basics.html «Непрерывные значения могут быть дискретизированы с использованием функций cut (интервалы на основе значений) и qcut (интервалы на основе выборочных квантилей)» Для меня это звучит очень абстрактно ... Я вижу различия в...

97
Каковы аргументы «уровни», «ключи» и имена в функции concat Pandas?

Вопросы Как пользоваться pd.concat? Для чего levelsнужен аргумент? Для чего keysнужен аргумент? Есть несколько примеров, которые помогут объяснить, как использовать все аргументы? concatФункция Pandas - это швейцарский армейский нож сливающихся утилит. Разнообразие ситуаций, в которых она может...

96
Строки в DataFrame, но dtype - это объект

Почему Pandas сообщает мне, что у меня есть объекты, хотя каждый элемент в выбранном столбце является строкой - даже после явного преобразования. Это мой DataFrame: <class 'pandas.core.frame.DataFrame'> Int64Index: 56992 entries, 0 to 56991 Data columns (total 7 columns): id 56992 non-null...

96
Как удалить пробелы из заголовков Pandas DataFrame?

Я анализирую данные из файла Excel, в заголовках некоторых столбцов которого есть лишние пробелы. Когда я проверяю столбцы полученного фрейма данных с помощью df.columns, я вижу: Index(['Year', 'Month ', 'Value']) ^ # Note the unwanted trailing space on 'Month ' Следовательно, я не могу:...

96
Есть ли у pandas iterrows проблемы с производительностью?

Я заметил очень плохую производительность при использовании строк от панд. Это то, что переживают другие? Это специфично для iterrows, и следует ли избегать этой функции для данных определенного размера (я работаю с 2-3 миллионами строк)? Это обсуждение на GitHub привело меня к мысли, что это...

96
Обновить значения строк, в которых выполняется определенное условие в пандах

Скажем, у меня есть следующий фрейм данных: Каков наиболее эффективный способ обновить значения столбцов feat и another_feat, где поток имеет номер 2 ? Это все? for index, row in df.iterrows(): if df1.loc[index,'stream'] == 2: # do something ОБНОВЛЕНИЕ: что делать, если у меня более 100 столбцов?...

96
В ноутбуке Jupyter две таблицы pandas расположены рядом

У меня есть два фрейма данных pandas, и я хотел бы отобразить их в блокноте Jupyter. Сделать что-то вроде: display(df1) display(df2) Показывает их одно под другим: Я хотел бы иметь второй фрейм данных справа от первого. Есть аналогичный вопрос , но похоже, что там человека устраивает либо...