Вопросы с тегом «pandas»

93
Python: получить счетчик частоты на основе двух столбцов (переменных) в кадре данных pandas в некоторых приложениях строк

Здравствуйте, у меня есть следующий фрейм данных. Group Size Short Small Short Small Moderate Medium Moderate Small Tall Large Я хочу подсчитать, сколько раз одна и та же строка появляется в кадре данных. Group Size Time Short Small 2 Moderate Medium 1 Moderate Small 1 Tall Large 1...

93
Предупреждение пользователя Python Pandas: сортировка, поскольку ось без объединения не выровнена

Я делаю некоторую практику кода и применяю слияние фреймов данных при этом, получая предупреждение пользователя /usr/lib64/python2.7/site-packages/pandas/core/frame.py:6201: FutureWarning: Сортировка, поскольку ось без конкатенации не выровнена. В будущей версии pandas по умолчанию будет отключена...

92
Python pandas: сохранить выбранный столбец как DataFrame вместо Series

При выборе одного столбца из фрейма данных pandas (скажем df.iloc[:, 0], df['A']или df.Aи т. Д.) Результирующий вектор автоматически преобразуется в серию, а не в фрейм данных с одним столбцом. Однако я пишу некоторые функции, которые принимают DataFrame в качестве входного аргумента. Поэтому я...

92
Разделение фрейма данных на несколько фреймов данных

У меня очень большой фрейм данных (около 1 миллиона строк) с данными эксперимента (60 респондентов). Я хотел бы разбить фрейм данных на 60 фреймов данных (фрейм данных для каждого участника). В кадре данных dataесть переменная с именем 'name', которая является уникальным кодом для каждого...

92
Pandas Groupby Диапазон ценностей

Есть ли в пандах простой метод для вызова groupbyдиапазона приращений значений? Например, в приведенном ниже примере я могу разбить и сгруппировать столбец Bс 0.155приращением, чтобы, например, первая пара групп в столбце была Bразделена на диапазоны между '0 - 0,155, 0,155 - 0,31 ... import numpy...

92
Преобразование серии pandas в DataFrame

У меня есть серия Pandas sf: email email1@email.com [1.0, 0.0, 0.0] email2@email.com [2.0, 0.0, 0.0] email3@email.com [1.0, 0.0, 0.0] email4@email.com [4.0, 0.0, 0.0] email5@email.com [1.0, 0.0, 3.0] email6@email.com [1.0, 5.0, 0.0] И я хотел бы преобразовать его в следующий DataFrame: index |...

92
Какие плюсы и минусы между get_dummies (Pandas) и OneHotEncoder (Scikit-learn)?

Я изучаю различные методы преобразования категориальных переменных в числовые для классификаторов машинного обучения. Я наткнулся на pd.get_dummiesметод и sklearn.preprocessing.OneHotEncoder()хотел посмотреть, чем они отличаются по производительности и использованию. Я нашел руководство по...

91
Объединение фреймов данных pandas по именам столбцов

У меня есть два фрейма данных со следующими именами столбцов: frame_1: event_id, date, time, county_ID frame_2: countyid, state Я хотел бы получить фрейм данных со следующими столбцами, присоединившись (слева) к county_ID = countyid: joined_dataframe event_id, date, time, county, state Я не могу...

91
Как отсортировать Pandas DataFrame по индексу?

Когда есть DataFrame, подобный следующему: import pandas as pd df = pd.DataFrame([1, 1, 1, 1, 1], index=[100, 29, 234, 1, 150], columns=['A']) Как я могу отсортировать этот фрейм данных по индексу с сохранением каждой комбинации индекса и значения столбца?...

91
Эквивалент Python Pandas в JavaScript

В этом примере CSV: Source,col1,col2,col3 foo,1,2,3 bar,3,4,5 Стандартный метод, который я использую Pandas, таков: Разобрать CSV Выберите столбцы во фрейме данных ( col1и col3) Обработка столбца (например, среднее значение col1и col3) Есть ли библиотека JavaScript, которая похожа на Pandas?...

90
Конкатенация строк двух столбцов панд

У меня есть следующее DataFrame: from pandas import * df = DataFrame({'foo':['a','b','c'], 'bar':[1, 2, 3]}) Выглядит это так: bar foo 0 1 a 1 2 b 2 3 c Теперь я хочу иметь что-то вроде: bar 0 1 is a 1 2 is b 2 3 is c Как я могу этого добиться? Я пробовал следующее: df['foo'] = '%s is %s' %...

90
Создание фрейма данных pandas из элементов вложенного словаря

Предположим, у меня есть вложенный словарь user_dict со структурой: Уровень 1: UserId (длинное целое число) Уровень 2: Категория (строка) Уровень 3: разные атрибуты (числа с плавающей запятой, целые числа и т. Д.) Например, запись этого словаря будет: user_dict[12] = { "Category 1": {"att_1": 1,...

90
Добавление метаинформации / метаданных в pandas DataFrame

Можно ли добавить некоторую метаинформацию / метаданные в DataFrame pandas? Например, название инструмента, используемого для измерения данных, ответственный инструмент и т. Д. Одним из способов решения этой проблемы было бы создание столбца с этой информацией, но кажется расточительным хранить...

89
Эффективное применение функции к сгруппированному фрейму данных pandas параллельно

Мне часто нужно применить функцию к очень большим группам DataFrame(смешанных типов данных), и я хотел бы использовать преимущества нескольких ядер. Я могу создать итератор из групп и использовать модуль многопроцессорности, но это неэффективно, потому что каждая группа и результаты функции должны...

89
Сохранение списка DataFrames в многолистовой электронной таблице Excel

Как я могу экспортировать список DataFrames в одну электронную таблицу Excel? Документы для to_excelсостояния: Примечания. При передаче существующего объекта ExcelWriter лист будет добавлен в существующую книгу. Это можно использовать для сохранения разных DataFrames в одну книгу. writer =...