Вопросы с тегом «pandas»

497

Преобразование вывода Pandas GroupBy из Series в DataFrame

Я начинаю с входных данных, как это df1 = pandas.DataFrame( { "Name" : ["Alice", "Bob", "Mallory", "Mallory", "Bob" , "Mallory"] , "City" : ["Seattle", "Seattle", "Portland", "Seattle", "Seattle", "Portland"] } ) Который при печати выглядит так: City Name 0 Seattle Alice 1 Seattle Bob 2 Portland...

488

Объедините два столбца текста в dataframe в pandas / python

У меня есть 20 x 4000 данных в Python с использованием панд. Два из этих столбцов названы Yearи quarter. Я хотел бы создать переменную с именем, periodкоторая делает Year = 2000и quarter= q2в2000q2 . Кто-нибудь может помочь с...

python pandas numpy dataframe

484

Как проверить, является ли какое-либо значение NaN в Pandas DataFrame

В Python Pandas, как лучше всего проверить, имеет ли DataFrame одно (или несколько) значений NaN? Я знаю о функции pd.isnan, но это возвращает DataFrame логических значений для каждого элемента. Этот пост прямо здесь не совсем отвечает и на мой...

python pandas dataframe nan

479

Установите значение для конкретной ячейки в панде DataFrame, используя индекс

Я создал Pandas DataFrame df = DataFrame(index=['A','B','C'], columns=['x','y']) и получил это ху NaN NaN B NaN NaN C NaN NaN Затем я хочу присвоить значение определенной ячейке, например, для строки «C» и столбца «x». Я ожидал получить такой результат: ху NaN NaN B NaN NaN C 10 NaN с этим кодом:...

python pandas dataframe

468

Конвертируйте pandas dataframe в массив NumPy

Я заинтересован в том, чтобы узнать, как преобразовать пандасный массив данных в массив NumPy. dataframe: import numpy as np import pandas as pd index = [1, 2, 3, 4, 5, 6, 7] a = [np.nan, np.nan, np.nan, 0.1, 0.1, 0.1, 0.1] b = [0.2, np.nan, 0.2, 0.2, 0.2, np.nan, np.nan] c = [np.nan, 0.5, 0.5,...

python arrays pandas numpy dataframe

468

Разница между картой, applymap и методами применения в Pandas

Можете ли вы сказать мне, когда использовать эти методы векторизации с основными примерами? Я вижу, что mapэто Seriesметод, а остальные DataFrameметоды. Я запутался applyи в applymapметодах, хотя. Почему у нас есть два метода для применения функции к DataFrame? Опять же, простые примеры, которые...

python pandas dataframe vectorization

464

Как посчитать значения NaN в столбце в панде DataFrame

У меня есть данные, в которых я хочу найти число NaN, так что, если оно меньше некоторого порога, я опущу эти столбцы. Я посмотрел, но не смог найти никакой функции для этого. есть value_counts, но это будет медленно для меня, потому что большинство значений различны, и я хочу NaNтолько подсчет...

python pandas dataframe

463

Создание пустого DataFrame Pandas, а затем его заполнение?

Я начинаю с документов панд DataFrame здесь: http://pandas.pydata.org/pandas-docs/stable/dsintro.html Я хотел бы итеративно заполнять DataFrame значениями для расчета временных рядов. В общем, я бы хотел инициализировать DataFrame столбцами A, B и строками отметок времени, все 0 или все NaN. Затем...

python dataframe pandas

458

Как я могу заменить все значения NaN на нули в столбце кадра данных pandas?

У меня есть датафрейм, как показано ниже itm Date Amount 67 420 2012-09-30 00:00:00 65211 68 421 2012-09-09 00:00:00 29424 69 421 2012-09-16 00:00:00 29877 70 421 2012-09-23 00:00:00 30990 71 421 2012-09-30 00:00:00 61303 72 485 2012-09-09 00:00:00 71781 73 485 2012-09-16 00:00:00 NaN 74 485...

python pandas dataframe

456

Как преобразовать индекс кадра данных панды в столбец?

Это кажется довольно очевидным, но я не могу понять, как преобразовать индекс фрейма данных в столбец? Например: df= gi ptt_loc 0 384444683 593 1 384444684 594 2 384444686 596 Чтобы, df= index1 gi ptt_loc 0 0 384444683 593 1 1 384444684 594 2 2 384444686 596...

python pandas dataframe

451

Выделение частичной строкой в панде DataFrame

У меня есть DataFrameс 4 столбцами, из которых 2 содержат строковые значения. Мне было интересно, если есть способ выбрать строки на основе частичного совпадения строк с конкретным столбцом? Другими словами, функция или лямбда-функция, которая будет делать что-то вроде re.search(pattern,...

python string pandas dataframe

441

Перемешать строки DataFrame

У меня есть следующий DataFrame: Col1 Col2 Col3 Type 0 1 2 3 1 1 4 5 6 1 ... 20 7 8 9 2 21 10 11 12 2 ... 45 13 14 15 3 46 16 17 18 3 ... DataFrame считывается из файла CSV. Все строки, которые имеют Type1, находятся сверху, за ними следуют строки с Type2, за которыми следуют строки с Type3 и т. Д....

python pandas dataframe permutation shuffle

439

Получить статистику для каждой группы (например, количество, среднее и т. Д.), Используя pandas GroupBy?

У меня есть фрейм данных, dfи я использую несколько столбцов из него, чтобы groupby: df['col1','col2','col3','col4'].groupby(['col1','col2']).mean() Таким образом, я почти получаю таблицу (фрейм данных), которая мне нужна. Чего не хватает, так это дополнительного столбца, который содержит...

python pandas dataframe group-by pandas-groupby

434

Как отфильтровать данные Pandas, используя 'in' и 'not in', как в SQL

Как я могу достичь эквивалентов SQL INи NOT IN? У меня есть список с необходимыми значениями. Вот сценарий: df = pd.DataFrame({'countries':['US','UK','Germany','China']}) countries = ['UK','China'] # pseudo-code: df[df['countries'] not in countries] Мой текущий способ сделать это заключается в...

python pandas dataframe sql-function

412

UnicodeDecodeError при чтении CSV-файла в Pandas с Python

Я запускаю программу, которая обрабатывает 30 000 похожих файлов. Случайное число из них останавливается и выдает эту ошибку ... File "C:\Importer\src\dfman\importer.py", line 26, in import_chr data = pd.read_csv(filepath, names=fields) File "C:\Python33\lib\site-packages\pandas\io\parsers.py",...

python pandas csv dataframe unicode

407

Как избежать Python / Pandas создания индекса в сохраненном CSV?

Я пытаюсь сохранить CSV в папку после внесения некоторых изменений в файл. Каждый раз, когда я использую pd.to_csv('C:/Path of file.csv')файл CSV имеет отдельный столбец индексов. Я хочу избежать печати индекса в CSV. Я старался: pd.read_csv('C:/Path to file to edit.csv', index_col = False) И...

python csv indexing pandas

404

Импортируйте несколько CSV-файлов в панды и объединяйте их в один DataFrame

Я хотел бы прочитать несколько CSV-файлов из каталога в панды и объединить их в один большой DataFrame. Я не был в состоянии понять это все же. Вот что у меня так далеко: import glob import pandas as pd # get data file names path =r'C:\DRO\DCL_rawdata_files' filenames = glob.glob(path + "/*.csv")...

python pandas csv dataframe concatenation

395

Выбор ряда серий / данных панд по целочисленному индексу

Мне любопытно, почему df[2]не поддерживается, пока df.ix[2]и df[2:3]работают оба. In [26]: df.ix[2] Out[26]: A 1.027680 B 1.514210 C -1.466963 D -0.162339 Name: 2000-01-03 00:00:00 In [27]: df[2:3] Out[27]: A B C D 2000-01-03 1.02768 1.51421 -1.466963 -0.162339 Я ожидал df[2]бы работать так же, как...

python pandas dataframe indexing

370

Построение pandas DataFrame из значений в переменных дает «ValueError: Если вы используете все скалярные значения, вы должны передать индекс»

Это может быть простой вопрос, но я не могу понять, как это сделать. Допустим, у меня есть две переменные следующим образом. a = 2 b = 3 Я хочу построить DataFrame из этого: df2 = pd.DataFrame({'A':a,'B':b}) Это приводит к ошибке: ValueError: Если используются все скалярные значения, вы должны...

python pandas dataframe scalar

370

Истинная ценность Серии неоднозначна. Используйте a.empty, a.bool (), a.item (), a.any () или a.all ()

Возникла проблема с фильтрацией моего результирующего кадра данных с orусловием. Я хочу, чтобы мой результат dfизвлекал все varзначения столбцов , которые выше 0,25 и ниже -0,25. Эта логика ниже дает мне неоднозначное значение истины, однако оно работает, когда я разделяю эту фильтрацию на две...

python pandas dataframe boolean filtering