Вопросы с тегом «pandas»

95
Получение вертикальных линий сетки для отображения на линейном графике в matplotlib

Я хочу, чтобы на моем графике отображались как горизонтальные, так и вертикальные линии сетки, но по умолчанию отображаются только горизонтальные линии сетки. Я использую pandas.DataFrameзапрос sql в python для создания линейного графика с датами на оси x. Я не уверен, почему они не появляются в...

95
Общее количество панд различно

Допустим, у меня есть журнал активности пользователей, и я хочу создать отчет с общей продолжительностью и количеством уникальных пользователей за день. import numpy as np import pandas as pd df = pd.DataFrame({'date': ['2013-04-01','2013-04-01','2013-04-01','2013-04-02', '2013-04-02'], 'user_id':...

95
Добавить столбец в фрейм данных из списка

У меня есть фрейм данных с такими столбцами: A B C 0 4 5 6 7 7 6 5 В Возможный диапазон значений в только от 0 до 7 . Кроме того, у меня есть список из 8 таких элементов: List=[2,5,6,8,12,16,26,32] //There are only 8 elements in this list Если элемент в столбце A равен n , мне нужно вставить n- й...

95
Добавление меток значений на гистограмму matplotlib

Я застрял на чем-то, что должно быть относительно легким. Код, который я привожу ниже, представляет собой образец, основанный на более крупном проекте, над которым я работаю. Я не видел причин публиковать все подробности, поэтому, пожалуйста, примите структуры данных, которые я привожу, как есть....

95
Как разбить список внутри ячейки Dataframe на отдельные строки

Я хочу превратить ячейку pandas, содержащую список, в строки для каждого из этих значений. Итак, возьмите это: Если я хочу распаковать и сложить значения в nearest_neighborsстолбце, чтобы каждое значение было строкой в ​​каждом opponentиндексе, как мне лучше всего это сделать? Существуют ли методы...

94
Панды Как отфильтровать серию

У меня есть такая серия после выполнения groupby ('name') и использования функции mean () в другом столбце name 383 3.000000 663 1.000000 726 1.000000 737 9.000000 833 8.166667 Может ли кто-нибудь показать мне, как отфильтровать строки со средними значениями 1 000 000? Спасибо, и я очень ценю вашу...

94
Удаление нескольких столбцов на основе имен столбцов в Pandas

У меня есть некоторые данные, и когда я их импортирую, я получаю следующие ненужные столбцы. Я ищу простой способ удалить все эти 'Unnamed: 24', 'Unnamed: 25', 'Unnamed: 26', 'Unnamed: 27', 'Unnamed: 28', 'Unnamed: 29', 'Unnamed: 30', 'Unnamed: 31', 'Unnamed: 32', 'Unnamed: 33', 'Unnamed: 34',...

94
Как передать еще один столбец целиком в качестве аргумента в pandas fillna ()

Я хотел бы заполнить недостающие значения в одном столбце значениями из другого столбца, используя fillnaметод. (Я читал, что перебирать каждую строку было бы очень плохой практикой и что было бы лучше делать все за один раз, но я не мог понять, как это сделать fillna.) Данные до: Day Cat1 Cat2 1...

94
Построение категориальных данных с помощью pandas и matplotlib

У меня есть фрейм данных с категориальными данными: colour direction 1 red up 2 blue up 3 green down 4 red left 5 red right 6 yellow down 7 blue down Я хочу создать несколько графиков, например круговых диаграмм и гистограмм, на основе категорий. Возможно ли это без создания фиктивных числовых...

94
Есть ли способ в Pandas использовать предыдущее значение строки в dataframe.apply, когда предыдущее значение также вычисляется в приложении?

У меня есть следующий фреймворк: Index_Date A B C D =============================== 2015-01-31 10 10 Nan 10 2015-02-01 2 3 Nan 22 2015-02-02 10 60 Nan 280 2015-02-03 10 100 Nan 250 Требовать: Index_Date A B C D =============================== 2015-01-31 10 10 10 10 2015-02-01 2 3 23 22 2015-02-02...

93
Большой постоянный DataFrame в пандах

Я изучаю возможность перехода на python и pandas как давний пользователь SAS. Однако при выполнении некоторых тестов сегодня я был удивлен, что python исчерпал память при попытке pandas.read_csv()создать csv-файл размером 128 МБ. В нем было около 200 000 строк и 200 столбцов, в основном числовых...

93
Преобразование Django QuerySet в pandas DataFrame

Я собираюсь преобразовать Django QuerySet в pandas DataFrameследующим образом: qs = SomeModel.objects.select_related().filter(date__year=2012) q = qs.values('date', 'OtherField') df = pd.DataFrame.from_records(q) Это работает, но есть ли более эффективный способ?...

93
Pandas Merge - Как избежать дублирования столбцов

Я пытаюсь объединить два фрейма данных. Каждый фрейм данных имеет два уровня индекса (дата, cusip). В столбцах некоторые столбцы совпадают между двумя (например, валюта, дата корректировки). Как лучше всего объединить их по индексу, но не брать две копии валюты и даты корректировки. Каждый фрейм...

93
Как динамически обновлять график в цикле в записной книжке Ipython (в пределах одной ячейки)

Среда: Python 2.7, matplotlib 1.3, IPython notebook 1.1, linux, chrome. Код находится в одной ячейке ввода, используя--pylab=inline Я хочу использовать блокнот IPython и pandas для использования потока и динамического обновления графика каждые 5 секунд. Когда я просто использую оператор печати для...

93
Pandas groupby кумулятивная сумма

Я хотел бы добавить столбец совокупной суммы в мой фрейм данных Pandas, чтобы: name | day | no -----|-----------|---- Jack | Monday | 10 Jack | Tuesday | 20 Jack | Tuesday | 10 Jack | Wednesday | 50 Jill | Monday | 40 Jill | Wednesday | 110 становится: Jack | Monday | 10 | 10 Jack | Tuesday | 30 |...

93
Python Pandas: как читать только первые n строк файлов CSV?

У меня очень большой набор данных, и я не могу позволить себе прочитать весь набор данных. Итак, я думаю прочитать только один его фрагмент для обучения, но я не знаю, как это сделать. Любая мысль будет оценена по достоинству....

93
Сортировка фреймов данных Pandas по дате

У меня есть фреймворк pandas следующим образом: Symbol Date A 02/20/2015 A 01/15/2016 A 08/21/2015 Я хочу отсортировать его Date, но столбец - это просто object. Я попытался сделать столбец объектом даты, но столкнулся с проблемой, когда этот формат не является нужным. Нужен формат 2015-02-20,и т....

93
Python Pandas: группировать по группам и в среднем?

У меня есть такой фрейм данных: cluster org time 1 a 8 1 a 6 2 h 34 1 c 23 2 d 74 3 w 6 Я хотел бы рассчитать среднее время, затрачиваемое на организацию на кластер. Ожидаемый результат: cluster mean(time) 1 15 ((8+6)/2+23)/2 2 54 (74+34)/2 3 6 Не знаю, как это сделать в Пандах, может кто поможет?...