Вопросы с тегом «dataframe»

98
Как я могу сделать заголовки столбцов фрейма данных pandas строчными буквами?

Я хочу сделать все заголовки столбцов в нижнем регистре моего фрейма данных pandas пример Если бы у меня был: data = country country isocode year XRAT tcgdp 0 Canada CAN 2001 1.54876 924909.44207 1 Canada CAN 2002 1.56932 957299.91586 2 Canada CAN 2003 1.40105 1016902.00180 .... Я хотел бы...

98
Pandas, выбирающий по метке, иногда возвращает Series, иногда возвращает DataFrame

В Pandas, когда я выбираю метку, которая имеет только одну запись в индексе, я возвращаю серию, но когда я выбираю запись, которая имеет более одной записи, я возвращаю фрейм данных. Почему это? Есть ли способ гарантировать, что я всегда получу фрейм данных? In [1]: import pandas as pd In [2]: df...

98
Преобразование фрейма данных pandas в серию

Я новичок в пандах. У меня есть кадр данных pandas, который составляет 1 строку на 23 столбца. Я хочу преобразовать это в серию? Мне интересно, какой самый питонический способ сделать это? Я пробовал, pd.Series(myResults)но жалуется ValueError: cannot copy sequence with size 23 to array axis with...

98
Python Pandas - Найдите разницу между двумя фреймами данных

У меня есть два фрейма данных df1 и df2, где df2 - это подмножество df1. Как мне получить новый фрейм данных (df3), который является разницей между двумя фреймами данных? Другими словами, фрейм данных, в котором есть все строки / столбцы в df1, которых нет в df2?...

97
Как построить два столбца фрейма данных pandas с использованием точек?

У меня есть фрейм данных pandas, и я хотел бы построить значения из одного столбца по сравнению со значениями из другого столбца. К счастью, есть plotметод, связанный с фреймами данных, который, кажется, делает то, что мне нужно: df.plot(x='col_name_1', y='col_name_2') К сожалению, похоже, что...

97
Переместить столбец по имени в начало таблицы в пандах

Вот мой df: Net Upper Lower Mid Zsore Answer option More than once a day 0% 0.22% -0.12% 2 65 Once a day 0% 0.32% -0.19% 3 45 Several times a week 2% 2.45% 1.10% 4 78 Once a week 1% 1.63% -0.40% 6 65 Как мне переместить столбец по имени ( "Mid") в начало таблицы, индекс 0. Вот как должен выглядеть...

97
Python Pandas заменяет NaN в одном столбце значением из соответствующей строки второго столбца

Я работаю с этим фреймом данных Pandas на Python. File heat Farheit Temp_Rating 1 YesQ 75 N/A 1 NoR 115 N/A 1 YesA 63 N/A 1 NoT 83 41 1 NoY 100 80 1 YesZ 56 12 2 YesQ 111 N/A 2 NoR 60 N/A 2 YesA 19 N/A 2 NoT 106 77 2 NoY 45 21 2 YesZ 40 54 3 YesQ 84 N/A 3 NoR 67 N/A 3 YesA 94 N/A 3 NoT 68 39 3 NoY...

96
Подмножество строк, содержащих значения NA (отсутствующие) в выбранном столбце фрейма данных

У нас есть фрейм данных из файла CSV. Во фрейме данных DFесть столбцы, содержащие наблюдаемые значения, и столбец ( VaR2), содержащий дату, когда было выполнено измерение. Если дата не была записана, CSV-файл содержит значение NAдля отсутствующих данных. Var1 Var2 10 2010/01/01 20 NA 30 2010/03/01...

95
Добавить столбец в фрейм данных из списка

У меня есть фрейм данных с такими столбцами: A B C 0 4 5 6 7 7 6 5 В Возможный диапазон значений в только от 0 до 7 . Кроме того, у меня есть список из 8 таких элементов: List=[2,5,6,8,12,16,26,32] //There are only 8 elements in this list Если элемент в столбце A равен n , мне нужно вставить n- й...

95
Как разбить список внутри ячейки Dataframe на отдельные строки

Я хочу превратить ячейку pandas, содержащую список, в строки для каждого из этих значений. Итак, возьмите это: Если я хочу распаковать и сложить значения в nearest_neighborsстолбце, чтобы каждое значение было строкой в ​​каждом opponentиндексе, как мне лучше всего это сделать? Существуют ли методы...

94
Как выбрать строку с максимальным значением в каждой группе

В наборе данных с несколькими наблюдениями для каждого субъекта я хочу взять подмножество только с максимальным значением данных для каждой записи. Например, со следующим набором данных: ID <- c(1,1,1,2,2,2,2,3,3) Value <- c(2,3,5,2,5,8,17,3,5) Event <- c(1,1,2,1,2,1,2,2,2) group <-...

94
Есть ли способ в Pandas использовать предыдущее значение строки в dataframe.apply, когда предыдущее значение также вычисляется в приложении?

У меня есть следующий фреймворк: Index_Date A B C D =============================== 2015-01-31 10 10 Nan 10 2015-02-01 2 3 Nan 22 2015-02-02 10 60 Nan 280 2015-02-03 10 100 Nan 250 Требовать: Index_Date A B C D =============================== 2015-01-31 10 10 10 10 2015-02-01 2 3 23 22 2015-02-02...

93
Python: получить счетчик частоты на основе двух столбцов (переменных) в кадре данных pandas в некоторых приложениях строк

Здравствуйте, у меня есть следующий фрейм данных. Group Size Short Small Short Small Moderate Medium Moderate Small Tall Large Я хочу подсчитать, сколько раз одна и та же строка появляется в кадре данных. Group Size Time Short Small 2 Moderate Medium 1 Moderate Small 1 Tall Large 1...

93
Переименование имен столбцов DataFrame в Spark Scala

Я пытаюсь преобразовать все заголовки / имена столбцов DataFrameв Spark-Scala. на данный момент я придумываю следующий код, который заменяет только одно имя столбца. for( i <- 0 to origCols.length - 1) { df.withColumnRenamed( df.columns(i), df.columns(i).toLowerCase ); }...

92
Разделение фрейма данных на несколько фреймов данных

У меня очень большой фрейм данных (около 1 миллиона строк) с данными эксперимента (60 респондентов). Я хотел бы разбить фрейм данных на 60 фреймов данных (фрейм данных для каждого участника). В кадре данных dataесть переменная с именем 'name', которая является уникальным кодом для каждого...

92
Преобразование серии pandas в DataFrame

У меня есть серия Pandas sf: email email1@email.com [1.0, 0.0, 0.0] email2@email.com [2.0, 0.0, 0.0] email3@email.com [1.0, 0.0, 0.0] email4@email.com [4.0, 0.0, 0.0] email5@email.com [1.0, 0.0, 3.0] email6@email.com [1.0, 5.0, 0.0] И я хотел бы преобразовать его в следующий DataFrame: index |...

91
Объединение фреймов данных pandas по именам столбцов

У меня есть два фрейма данных со следующими именами столбцов: frame_1: event_id, date, time, county_ID frame_2: countyid, state Я хотел бы получить фрейм данных со следующими столбцами, присоединившись (слева) к county_ID = countyid: joined_dataframe event_id, date, time, county, state Я не могу...

90
Конкатенация строк двух столбцов панд

У меня есть следующее DataFrame: from pandas import * df = DataFrame({'foo':['a','b','c'], 'bar':[1, 2, 3]}) Выглядит это так: bar foo 0 1 a 1 2 b 2 3 c Теперь я хочу иметь что-то вроде: bar 0 1 is a 1 2 is b 2 3 is c Как я могу этого добиться? Я пробовал следующее: df['foo'] = '%s is %s' %...

90
Создание фрейма данных pandas из элементов вложенного словаря

Предположим, у меня есть вложенный словарь user_dict со структурой: Уровень 1: UserId (длинное целое число) Уровень 2: Категория (строка) Уровень 3: разные атрибуты (числа с плавающей запятой, целые числа и т. Д.) Например, запись этого словаря будет: user_dict[12] = { "Category 1": {"att_1": 1,...