Вопросы с тегом «pandas»

484
Как проверить, является ли какое-либо значение NaN в Pandas DataFrame

В Python Pandas, как лучше всего проверить, имеет ли DataFrame одно (или несколько) значений NaN? Я знаю о функции pd.isnan, но это возвращает DataFrame логических значений для каждого элемента. Этот пост прямо здесь не совсем отвечает и на мой...

479
Установите значение для конкретной ячейки в панде DataFrame, используя индекс

Я создал Pandas DataFrame df = DataFrame(index=['A','B','C'], columns=['x','y']) и получил это ху NaN NaN B NaN NaN C NaN NaN Затем я хочу присвоить значение определенной ячейке, например, для строки «C» и столбца «x». Я ожидал получить такой результат: ху NaN NaN B NaN NaN C 10 NaN с этим кодом:...

468
Разница между картой, applymap и методами применения в Pandas

Можете ли вы сказать мне, когда использовать эти методы векторизации с основными примерами? Я вижу, что mapэто Seriesметод, а остальные DataFrameметоды. Я запутался applyи в applymapметодах, хотя. Почему у нас есть два метода для применения функции к DataFrame? Опять же, простые примеры, которые...

464
Как посчитать значения NaN в столбце в панде DataFrame

У меня есть данные, в которых я хочу найти число NaN, так что, если оно меньше некоторого порога, я опущу эти столбцы. Я посмотрел, но не смог найти никакой функции для этого. есть value_counts, но это будет медленно для меня, потому что большинство значений различны, и я хочу NaNтолько подсчет...

463
Создание пустого DataFrame Pandas, а затем его заполнение?

Я начинаю с документов панд DataFrame здесь: http://pandas.pydata.org/pandas-docs/stable/dsintro.html Я хотел бы итеративно заполнять DataFrame значениями для расчета временных рядов. В общем, я бы хотел инициализировать DataFrame столбцами A, B и строками отметок времени, все 0 или все NaN. Затем...

451
Выделение частичной строкой в ​​панде DataFrame

У меня есть DataFrameс 4 столбцами, из которых 2 содержат строковые значения. Мне было интересно, если есть способ выбрать строки на основе частичного совпадения строк с конкретным столбцом? Другими словами, функция или лямбда-функция, которая будет делать что-то вроде re.search(pattern,...

441
Перемешать строки DataFrame

У меня есть следующий DataFrame: Col1 Col2 Col3 Type 0 1 2 3 1 1 4 5 6 1 ... 20 7 8 9 2 21 10 11 12 2 ... 45 13 14 15 3 46 16 17 18 3 ... DataFrame считывается из файла CSV. Все строки, которые имеют Type1, находятся сверху, за ними следуют строки с Type2, за которыми следуют строки с Type3 и т. Д....

439
Получить статистику для каждой группы (например, количество, среднее и т. Д.), Используя pandas GroupBy?

У меня есть фрейм данных, dfи я использую несколько столбцов из него, чтобы groupby: df['col1','col2','col3','col4'].groupby(['col1','col2']).mean() Таким образом, я почти получаю таблицу (фрейм данных), которая мне нужна. Чего не хватает, так это дополнительного столбца, который содержит...

434
Как отфильтровать данные Pandas, используя 'in' и 'not in', как в SQL

Как я могу достичь эквивалентов SQL INи NOT IN? У меня есть список с необходимыми значениями. Вот сценарий: df = pd.DataFrame({'countries':['US','UK','Germany','China']}) countries = ['UK','China'] # pseudo-code: df[df['countries'] not in countries] Мой текущий способ сделать это заключается в...

412
UnicodeDecodeError при чтении CSV-файла в Pandas с Python

Я запускаю программу, которая обрабатывает 30 000 похожих файлов. Случайное число из них останавливается и выдает эту ошибку ... File "C:\Importer\src\dfman\importer.py", line 26, in import_chr data = pd.read_csv(filepath, names=fields) File "C:\Python33\lib\site-packages\pandas\io\parsers.py",...

407
Как избежать Python / Pandas создания индекса в сохраненном CSV?

Я пытаюсь сохранить CSV в папку после внесения некоторых изменений в файл. Каждый раз, когда я использую pd.to_csv('C:/Path of file.csv')файл CSV имеет отдельный столбец индексов. Я хочу избежать печати индекса в CSV. Я старался: pd.read_csv('C:/Path to file to edit.csv', index_col = False) И...

404
Импортируйте несколько CSV-файлов в панды и объединяйте их в один DataFrame

Я хотел бы прочитать несколько CSV-файлов из каталога в панды и объединить их в один большой DataFrame. Я не был в состоянии понять это все же. Вот что у меня так далеко: import glob import pandas as pd # get data file names path =r'C:\DRO\DCL_rawdata_files' filenames = glob.glob(path + "/*.csv")...

395
Выбор ряда серий / данных панд по целочисленному индексу

Мне любопытно, почему df[2]не поддерживается, пока df.ix[2]и df[2:3]работают оба. In [26]: df.ix[2] Out[26]: A 1.027680 B 1.514210 C -1.466963 D -0.162339 Name: 2000-01-03 00:00:00 In [27]: df[2:3] Out[27]: A B C D 2000-01-03 1.02768 1.51421 -1.466963 -0.162339 Я ожидал df[2]бы работать так же, как...

370
Построение pandas DataFrame из значений в переменных дает «ValueError: Если вы используете все скалярные значения, вы должны передать индекс»

Это может быть простой вопрос, но я не могу понять, как это сделать. Допустим, у меня есть две переменные следующим образом. a = 2 b = 3 Я хочу построить DataFrame из этого: df2 = pd.DataFrame({'A':a,'B':b}) Это приводит к ошибке: ValueError: Если используются все скалярные значения, вы должны...

370
Истинная ценность Серии неоднозначна. Используйте a.empty, a.bool (), a.item (), a.any () или a.all ()

Возникла проблема с фильтрацией моего результирующего кадра данных с orусловием. Я хочу, чтобы мой результат dfизвлекал все varзначения столбцов , которые выше 0,25 и ниже -0,25. Эта логика ниже дает мне неоднозначное значение истины, однако оно работает, когда я разделяю эту фильтрацию на две...