Вопросы с тегом «pandas»

150
python pandas: применить функцию с аргументами к серии

Я хочу применить функцию с аргументами к серии в python pandas: x = my_series.apply(my_function, more_arguments_1) y = my_series.apply(my_function, more_arguments_2) ... В документации описывается поддержка метода apply, но он не принимает никаких аргументов. Есть ли другой метод, принимающий...

148
Разделение словаря / списка внутри столбца панд на отдельные столбцы

У меня есть данные, сохраненные в базе данных postgreSQL. Я запрашиваю эти данные с помощью Python2.7 и превращаю их в Pandas DataFrame. Однако последний столбец этого информационного кадра содержит словарь (или список?) Значений внутри него. DataFrame выглядит следующим образом: [1] df Station ID...

148
Процент панд от общего с групповым

Это очевидно просто, но как новичок я застрял. У меня есть CSV-файл, который содержит 3 столбца: штат, идентификатор офиса и продажи для этого офиса. Я хочу рассчитать процент продаж на офис в данном состоянии (общее количество всех процентов в каждом штате составляет 100%). df =...

148
Изменение подмножества строк в кадре данных pandas

Предположим, у меня есть DataFrame pandas с двумя столбцами, A и B. Я хотел бы изменить этот DataFrame (или создать копию), чтобы B всегда был NaN, когда A равно 0. Как мне этого добиться? Я пробовал следующее df['A'==0]['B'] = np.nan а также df['A'==0]['B'].values.fill(np.nan) безуспешно....

148
Выберите строки в pandas MultiIndex DataFrame

Каковы наиболее распространенные способы выбора / фильтрации строк фрейма данных, индекс которого является MultiIndex ? Нарезка на основе одного значения / метки Нарезка на основе нескольких этикеток с одного или нескольких уровней Фильтрация по логическим условиям и выражениям Какие методы...

146
Как разбить данные на 3 набора (тренировка, проверка и тестирование)?

У меня есть датафрейм pandas, и я хочу разделить его на 3 отдельных набора. Я знаю , что с помощью train_test_split из sklearn.cross_validation, можно разделить данные в двух сетах (поезд и тест). Тем не менее, я не смог найти никакого решения о разделении данных на три набора. Желательно, чтобы у...

145
Проверьте, существует ли значение в индексе фрейма данных pandas

Я уверен, что есть очевидный способ сделать это, но сейчас не могу придумать ничего приятного. В основном, вместо того, чтобы вызывать исключение, я хотел бы получить Trueили Falseувидеть, существует ли значение в dfиндексе pandas . import pandas as pd df = pd.DataFrame({'test':[1,2,3,4]},...

144
Как найти, какие столбцы содержат любое значение NaN в кадре данных Pandas

Дан кадр данных панд, содержащий возможные значения NaN, разбросанные здесь и там: Вопрос: Как определить, какие столбцы содержат значения NaN? В частности, могу ли я получить список имен столбцов, содержащих...

144
JSON для панд DataFrame

Я пытаюсь извлечь данные о высоте из API карт Google по пути, указанному координатами широты и долготы, следующим образом: from urllib2 import Request, urlopen import json path1 = '42.974049,-81.205203|42.974298,-81.195755'...

144
Чтение файла Excel в Python с использованием панд

Я пытаюсь прочитать файл Excel следующим образом: newFile = pd.ExcelFile(PATH\FileName.xlsx) ParsedData = pd.io.parsers.ExcelFile.parse(newFile) которая выдает ошибку, которая говорит о двух ожидаемых аргументах, я не знаю, что является вторым аргументом, а также что я пытаюсь достичь здесь, это...

144
Панды: поиск списка листов в файле Excel

Новая версия Pandas использует следующий интерфейс для загрузки файлов Excel: read_excel('path_to_file.xls', 'Sheet1', index_col=None, na_values=['NA']) но что если я не знаю доступные листы? Например, я работаю с файлами Excel, которые следующие листы Данные 1, Данные 2 ..., Данные N, foo, bar но...

142
Искать «не содержит» в DataFrame в pandas

Я немного поискал и не могу понять, как отфильтровать фрейм данных df["col"].str.contains(word), однако мне интересно, есть ли способ сделать обратное: отфильтровать фрейм данных с помощью этого набора. например: эффект !(df["col"].str.contains(word)). Можно ли это сделать с помощью...

142
Переименовать Pandas DataFrame Index

У меня есть CSV-файл без заголовка с индексом DateTime. Я хочу переименовать индекс и имя столбца, но с помощью df.rename () переименовывается только имя столбца. Ошибка? Я на версии 0.12.0 In [2]: df = pd.read_csv(r'D:\Data\DataTimeSeries_csv//seriesSM.csv', header=None, parse_dates=[[0]],...

141
Замена значений столбцов в панде DataFrame

Я пытаюсь заменить значения в одном столбце данных. Столбец («женский») содержит только значения «женский» и «мужской». Я пробовал следующее: w['female']['female']='1' w['female']['male']='0' Но получите точно такую ​​же копию предыдущих результатов. В идеале я хотел бы получить некоторый вывод,...

139
Панды read_csv из URL

Я использую Python 3.4 с IPython и имею следующий код. Я не могу прочитать csv-файл по указанному URL: import pandas as pd import requests url="https://github.com/cs109/2014_data/blob/master/countries.csv" s=requests.get(url).content c=pd.read_csv(s) У меня следующая ошибка «Ожидаемый путь к файлу...

138
Панды: Настройка №. из макс строк

У меня проблема с просмотром следующего DataFrame: n = 100 foo = DataFrame(index=range(n)) foo['floats'] = np.random.randn(n) foo Проблема заключается в том, что он не печатает все строки по умолчанию в записной книжке ipython, но мне нужно нарезать, чтобы просмотреть результирующие строки. Даже...

138
масштабирование столбцов в пандах с помощью sklearn

У меня есть фреймворк pandas со столбцами смешанного типа, и я хотел бы применить min_max_scaler sklearn к некоторым столбцам. В идеале я хотел бы выполнить эти преобразования на месте, но еще не придумал, как это сделать. Я написал следующий код, который работает: import pandas as pd import numpy...