Вопросы с тегом «pandas»

289
получить список из столбца данных панд

У меня есть документ Excel, который выглядит следующим образом .. cluster load_date budget actual fixed_price A 1/1/2014 1000 4000 Y A 2/1/2014 12000 10000 Y A 3/1/2014 36000 2000 Y B 4/1/2014 15000 10000 N B 4/1/2014 12000 11500 N B 4/1/2014 90000 11000 N C 7/1/2014 22000 18000 N C 8/1/2014 30000...

281
Создание Pandas DataFrame из массива Numpy: как указать столбец индекса и заголовки столбцов?

У меня есть массив Numpy, состоящий из списка списков, представляющих двумерный массив с метками строк и именами столбцов, как показано ниже: data = array([['','Col1','Col2'],['Row1',1,2],['Row2',3,4]]) Я хотел бы, чтобы результирующий DataFrame имел Row1 и Row2 в качестве значений индекса, а Col1,...

278
Python Pandas: получить индекс строк, столбец которых соответствует определенному значению

Учитывая DataFrame со столбцом «BoolCol», мы хотим найти индексы DataFrame, в которых значения для «BoolCol» == True В настоящее время у меня есть итеративный способ сделать это, который отлично работает: for i in range(100,3000): if df.iloc[i]['BoolCol']== True: print i,df.iloc[i]['BoolCol'] Но...

276
Создать Pandas DataFrame из строки

Чтобы протестировать некоторые функции, я хотел бы создать DataFrameстроку. Допустим, мои тестовые данные выглядят так: TESTDATA="""col1;col2;col3 1;4.4;99 2;4.5;200 3;4.7;65 4;3.2;140 """ Какой самый простой способ прочитать эти данные в панд...

274
Как сгруппировать строки данных в список в pandas groupby?

У меня есть фрейма данных панд, dfкак: a b A 1 A 2 B 5 B 5 B 4 C 6 Я хочу сгруппировать по первому столбцу и получить второй столбец в виде списков в строках : A [1,2] B [5,5,4] C [6] Можно ли сделать что-то подобное с помощью групповых...

269
Что означает ось в пандах?

Вот мой код для генерации кадра данных: import pandas as pd import numpy as np dff = pd.DataFrame(np.random.randn(1,2),columns=list('AB')) тогда я получил датафрейм: +------------+---------+--------+ | | A | B | +------------+---------+--------- | 0 | 0.626386| 1.52325|...

264
Как взять столбцы-фрагменты данных в пандах

Я загружаю некоторые данные машинного обучения из файла CSV. Первые 2 столбца являются наблюдениями, а остальные столбцы - объектами. В настоящее время я делаю следующее: data = pandas.read_csv('mydata.csv') который дает что-то вроде: data = pandas.DataFrame(np.random.rand(10,5), columns =...

260
Панды: Как я могу использовать функцию apply () для одного столбца?

У меня есть кадр данных панд с двумя столбцами. Мне нужно изменить значения первого столбца, не затрагивая второй, и получить обратно весь фрейм данных только с измененными значениями первого столбца. Как я могу сделать это, используя apply в...

255
Что означает «ValueError: невозможно переиндексировать с дублированной оси»?

Я получаю, ValueError: cannot reindex from a duplicate axisкогда я пытаюсь установить индекс на определенное значение. Я попытался воспроизвести это на простом примере, но я не смог этого сделать. Вот мой сеанс внутри ipdbтрассировки. У меня есть DataFrame со строковым индексом и целочисленными...

255
Название или название столбца индекса панд

Как я могу получить имя столбца индекса в пандах Python? Вот пример кадра данных: Column 1 Index Title Apples 1 Oranges 2 Puppies 3 Ducks 4 Я пытаюсь получить / установить заголовок индекса данных. Вот что я попробовал: import pandas as pd data = {'Column 1' : [1., 2., 3., 4.], 'Index Title' :...

252
Удалить строки с дублирующимися индексами (Pandas DataFrame и TimeSeries)

Я читаю некоторые автоматические данные о погоде из Интернета. Наблюдения происходят каждые 5 минут и собираются в ежемесячные файлы для каждой метеостанции. Как только я закончу анализ файла, DataFrame будет выглядеть примерно так: Sta Precip1hr Precip5min Temp DewPnt WindSpd WindDir AtmPress Date...