Вопросы с тегом «pandas»

369
Как применить функцию к двум столбцам Pandas dataframe

Предположим, у меня dfесть столбцы 'ID', 'col_1', 'col_2'. И я определяю функцию: f = lambda x, y : my_function_expression, Теперь я хочу , чтобы применить fк dfдвум колонкам «S 'col_1', 'col_2'для поэлементнога рассчитает новый столбец 'col_3', несколько как: df['col_3'] =...

366
Панды Слияния 101

Как выполнить ( LEFT| RIGHT| FULL) ( INNER| OUTER) соединение с пандами? Как добавить NaN для пропущенных строк после слияния? Как избавиться от NaNs после слияния? Можно ли слить по индексу? Крест соединиться с пандами? Как объединить несколько фреймов данных? merge? join? concat? update? ВОЗ?...

359
Как развернуть датафрейм

Что такое пивот? Как мне повернуть? Это стержень? Длинный формат для широкого формата? Я видел много вопросов о сводных таблицах. Даже если они не знают, что спрашивают о сводных таблицах, они обычно так и делают. Практически невозможно написать канонический вопрос и ответ, который охватывает все...

347
Как получить значение из ячейки информационного кадра?

Я построил условие, которое извлекает ровно одну строку из моего фрейма данных: d2 = df[(df['l_ext']==l_ext) & (df['item']==item) & (df['wn']==wn) & (df['wd']==1)] Теперь я хотел бы взять значение из определенного столбца: val = d2['col_name'] Но в результате я получаю фрейм данных,...

343
Python Pandas Ошибка токенизации данных

Я пытаюсь использовать панд для манипулирования файлом .csv, но я получаю эту ошибку: pandas.parser.CParserError: Ошибка токенизации данных. Ошибка С: ожидается 2 поля в строке 3, пила 12 Я пытался читать документы панд, но ничего не нашел. Мой код прост: path = 'GOOG Key Ratios.csv'...

329
Панды: фильтровать строки DataFrame с оператором цепочки

Большинство операций в pandasможет быть выполнены с помощью оператора цепочки ( groupby, aggregate, apply, и т.д.), но единственным способом я нашел для фильтра строк с помощью обычной индексации кронштейна df_filtered = df[df['column'] == value] Это непривлекательно, так как требует, чтобы я...

324
Как создать тестовые и обучающие образцы из одного кадра данных с пандами?

У меня есть довольно большой набор данных в виде фрейма данных, и мне было интересно, как я смогу разделить фрейм данных на две случайные выборки (80% и 20%) для обучения и тестирования....

320
Панды read_csv low_memory и опции dtype

При звонке df = pd.read_csv('somefile.csv') Я получил: /Users/josh/anaconda/envs/py27/lib/python2.7/site-packages/pandas/io/parsers.py:1130: DtypeWarning: столбцы (4,5,7,16) имеют смешанные типы. Укажите опцию dtype при импорте или установите low_memory = False. Почему этот dtypeвариант связан с...

318
Переопределить значения в столбце панд с помощью dict

У меня есть словарь, который выглядит так: di = {1: "A", 2: "B"} Я хотел бы применить его к столбцу "col1" в кадре данных, похожем на: col1 col2 0 w a 1 1 2 2 2 NaN получить: col1 col2 0 w a 1 A 2 2 B NaN Как я могу лучше всего это сделать? По некоторым причинам термины поиска в Google, относящиеся...

317
Как хранить данные с помощью Pandas

Прямо сейчас я импортирую довольно большой CSVфайл данных каждый раз, когда запускаю скрипт. Есть ли хорошее решение для того, чтобы держать этот фрейм данных постоянно доступным между запусками, чтобы мне не пришлось тратить все это время на ожидание запуска...

316
Панды создают новый столбец на основе значений из других столбцов / применяют функцию из нескольких столбцов, построчно

Я хочу , чтобы применить свою пользовательскую функцию (она использует если-иначе лестница) в этих шести колонн ( ERI_Hispanic, ERI_AmerInd_AKNatv, ERI_Asian, ERI_Black_Afr.Amer, ERI_HI_PacIsl, ERI_White) в каждой строке моего dataframe. Я пробовал разные методы из других вопросов, но все еще не...

314
Pandas условное создание столбца серии / dataframe

У меня есть датафрейм по линии ниже: Type Set 1 A Z 2 B Z 3 B X 4 C Y Я хочу добавить еще один столбец к фрейму данных (или сгенерировать серию) той же длины, что и фрейм данных (= равное количество записей / строк), который устанавливает зеленый цвет, если Set = 'Z', и 'красный', если Set = иначе...

303
Удалите строки из DataFrame pandas на основе условного выражения с использованием len (string), дающего KeyError

У меня есть DataFrame pandas, и я хочу удалить из него строки, где длина строки в определенном столбце больше 2. Я ожидаю, что смогу сделать это (за этот ответ ): df[(len(df['column name']) < 2)] но я просто получаю ошибку: KeyError: u'no item named False' Что я делаю не так? (Примечание: я...

301
Панды - Получить значение первой строки данного столбца

Это кажется нелепо простым вопросом ... но я не вижу простого ответа, которого ожидал. Итак, как мне получить значение в n-й строке данного столбца в Pandas? (Я особенно заинтересован в первом ряду, но также был бы заинтересован в более общей практике). Например, скажем, я хочу получить значение...

289
получить список из столбца данных панд

У меня есть документ Excel, который выглядит следующим образом .. cluster load_date budget actual fixed_price A 1/1/2014 1000 4000 Y A 2/1/2014 12000 10000 Y A 3/1/2014 36000 2000 Y B 4/1/2014 15000 10000 N B 4/1/2014 12000 11500 N B 4/1/2014 90000 11000 N C 7/1/2014 22000 18000 N C 8/1/2014 30000...