Вопросы с тегом «pandas»

89
Графики разброса в Pandas / Pyplot: как строить по категориям

Я пытаюсь создать простую диаграмму рассеяния в pyplot с использованием объекта Pandas DataFrame, но мне нужен эффективный способ построения двух переменных, но для символов, продиктованных третьим столбцом (ключом). Я пробовал различные способы использования df.groupby, но безуспешно. Ниже...

89
Аннотирование столбцов со значениями на диаграммах столбцов Pandas

Я искал способ аннотировать свои столбцы на графике столбцов Pandas округленными числовыми значениями из моего DataFrame. >>> df=pd.DataFrame({'A':np.random.rand(2),'B':np.random.rand(2)},index=['value1','value2'] ) >>> df A B value1 0.440922 0.911800 value2 0.588242 0.797366...

89
Разница (я) между merge () и concat () в пандах

В чем существенное различие между pd.DataFrame.merge()и pd.concat()? Пока что это то, что я обнаружил, прокомментируйте, пожалуйста, насколько полно и точно я понимаю: .merge()может использовать только столбцы (плюс индексы строк) и семантически подходит для операций в стиле базы данных....

89
В чем разница между пером и паркетом?

Оба являются колоночными (дисковыми) форматами хранения для использования в системах анализа данных. Оба интегрированы в Apache Arrow ( пакет pyarrow для python) и предназначены для соответствия со Arrow как столбцовым аналитическим слоем в памяти. Чем отличаются оба формата? Всегда ли вы...

88
float64 с пандами to_csv

Я читаю CSV с такими числами с плавающей запятой: Bob,0.085 Alice,0.005 И импортируйте в фрейм данных и запишите этот фрейм данных в новое место df = pd.read_csv(orig) df.to_csv(pandasfile) Теперь это pandasfile: Bob,0.085000000000000006 Alice,0.0050000000000000001 Что случилось? возможно, мне...

88
Мультииндексная сортировка в пандах

У меня есть набор данных с многоиндексными столбцами в pandas df, который я хотел бы отсортировать по значениям в определенном столбце. Я пробовал использовать sortindex и sortlevel, но не смог получить требуемых результатов. Мой набор данных выглядит так: Group1 Group2 A B C A B C 1 1 0 3 2 5 7 2...

88
Сделайте более одной диаграммы в одной ячейке IPython Notebook

Я начал свой ноутбук IPython с ipython notebook --pylab inline Это мой код в одной ячейке df['korisnika'].plot() df['osiguranika'].plot() Он работает нормально, он рисует две линии, но на одном графике. Я хотел бы нарисовать каждую линию на отдельном графике. И было бы здорово, если бы графики...

88
Панды: заполнение пропущенных значений средним в каждой группе

Это должно быть просто, но самое близкое, что я нашел, это этот пост: pandas: Заполнение недостающих значений внутри группы , и я все еще не могу решить свою проблему .... Предположим, у меня есть следующий фрейм данных df = pd.DataFrame({'value': [1, np.nan, np.nan, 2, 3, 1, 3, np.nan, 3],...

88
Преобразование числовых строк с запятыми в pandas DataFrame в float

У меня есть DataFrame, который содержит числа в виде строк с запятыми для маркера тысяч. Мне нужно преобразовать их в числа с плавающей запятой. a = [['1,200', '4,200'], ['7,000', '-0.03'], [ '5', '0']] df=pandas.DataFrame(a) Я предполагаю, что мне нужно использовать locale.atof. На самом деле...

88
Примеры наборов данных в Pandas

При использовании R удобно загружать "практические" наборы данных, используя data(iris) или data(mtcars) Есть что-то подобное для Панд? Я знаю, что могу загрузить любой другой метод, просто интересно, есть ли что-нибудь встроенное....

88
Панды суммируются по группам, но исключают определенные столбцы

Каков наилучший способ сделать groupby в кадре данных Pandas, но исключить некоторые столбцы из этой groupby? например, у меня есть следующий фрейм данных: Code Country Item_Code Item Ele_Code Unit Y1961 Y1962 Y1963 2 Afghanistan 15 Wheat 5312 Ha 10 20 30 2 Afghanistan 25 Maize 5312 Ha 10 20 30 4...

88
Фрейм данных python pandas, это передача по значению или по ссылке

Если я передаю фрейм данных функции и изменю его внутри функции, будет ли это передача по значению или по ссылке? Я запускаю следующий код a = pd.DataFrame({'a':[1,2], 'b':[3,4]}) def letgo(df): df = df.drop('b',axis=1) letgo(a) значение aне меняется после вызова функции. Означает ли это, что это...

87
Панды: как изменить все значения столбца?

У меня есть фрейм данных с названным столбцом, "Date"и я хочу, чтобы все значения из этого столбца имели одинаковое значение (только год). Пример: City Date Paris 01/04/2004 Lisbon 01/09/2004 Madrid 2004 Pekin 31/2004 Я хочу: City Date Paris 2004 Lisbon 2004 Madrid 2004 Pekin 2004 Вот мой код:...

87
График временных рядов Pandas, устанавливающий основные и второстепенные отметки и метки по оси X

Я хочу иметь возможность устанавливать основные и второстепенные xticks и их метки для графика временных рядов, построенного из объекта временного ряда Pandas. На странице "Что нового" в Pandas 0.9 говорится: "вы можете использовать to_pydatetime или зарегистрировать конвертер для типа Timestamp"...

87
Панды: скользящее среднее по временному интервалу

Я новичок в Pandas .... У меня есть много данных опроса; Я хочу вычислить скользящее среднее, чтобы получить оценку на каждый день на основе трехдневного окна. Как я понял из этого вопроса , функции Rolling_ * вычисляют окно на основе указанного количества значений, а не определенного диапазона...