Вопросы с тегом «pandas»

219

Панды Заменить NaN пустой / пустой строкой

У меня есть Pandas Dataframe, как показано ниже: 1 2 3 0 a NaN read 1 b l unread 2 c NaN read Я хочу удалить значения NaN с пустой строкой, чтобы это выглядело так: 1 2 3 0 a "" read 1 b l unread 2 c "" read...

218

Кодирование меток в нескольких столбцах в scikit-learn

Я пытаюсь использовать scikit-learn's LabelEncoderдля кодирования панд DataFrameстроковых меток. Поскольку в фрейме данных есть много (более 50) столбцов, я хочу избежать создания LabelEncoderобъекта для каждого столбца; Я бы предпочел просто иметь один большой LabelEncoderобъект, который работает...

python pandas scikit-learn neuraxle

216

Применить функцию панды к столбцу, чтобы создать несколько новых столбцов?

Как это сделать в пандах: У меня есть функция extract_text_featuresдля одного текстового столбца, возвращающая несколько выходных столбцов. В частности, функция возвращает 6 значений. Функция работает, однако, похоже, не существует какого-либо правильного возвращаемого типа (pandas DataFrame /...

python pandas merge multiple-columns return-type

214

Как отобразить полную (не усеченную) информацию о фрейме данных в html при конвертации из фрейма данных pandas в html?

Я преобразовал pandas dataframe в вывод html, используя DataFrame.to_htmlфункцию. Когда я сохраняю это в отдельный HTML-файл, файл показывает усеченный вывод. Например, в моей колонке ТЕКСТ, df.head(1) покажет Фильм был отличным усилием ... вместо того Фильм был отличным усилием в деконструкции...

python html pandas

214

Обновите фрейм данных в пандах, повторяя построчно

У меня есть фрейм данных панд, который выглядит следующим образом (это довольно большой) date exer exp ifor mat 1092 2014-03-17 American M 528.205 2014-04-19 1093 2014-03-17 American M 528.205 2014-04-19 1094 2014-03-17 American M 528.205 2014-04-19 1095 2014-03-17 American M 528.205 2014-04-19...

python pandas updates dataframe

212

Матрица корреляции участков с использованием панд

У меня есть набор данных с огромным количеством функций, поэтому анализ матрицы корреляции стал очень трудным. Я хочу построить корреляционную матрицу, которую мы получаем, используя dataframe.corr()функцию из библиотеки панд. Есть ли встроенная функция, предоставляемая библиотекой панд для...

python pandas matplotlib data-visualization information-visualization

212

Присоединяешься к пустому DataFrame в Pandas?

Можно ли добавить пустой фрейм данных, который не содержит индексов или столбцов? Я пытался сделать это, но продолжаю получать пустой фрейм данных в конце. например df = pd.DataFrame() data = ['some kind of data here' --> I have checked the type already, and it is a dataframe] df.append(data)...

python pandas

209

Найти строку, где значения столбца максимальны в панде DataFrame

Как найти строку, для которой значение определенного столбца является максимальным ? df.max() даст мне максимальное значение для каждого столбца, я не знаю, как получить соответствующую...

python pandas argmax

208

В чем разница между объединением и слиянием в пандах?

Предположим, у меня есть два DataFrames, например, так: left = pd.DataFrame({'key1': ['foo', 'bar'], 'lval': [1, 2]}) right = pd.DataFrame({'key2': ['foo', 'bar'], 'rval': [4, 5]}) Я хочу объединить их, поэтому я пытаюсь что-то вроде этого: pd.merge(left, right, left_on='key1', right_on='key2') И я...

python pandas dataframe join

207

Панды сгруппированы по сумме

Я использую этот фрейм данных: Fruit Date Name Number Apples 10/6/2016 Bob 7 Apples 10/6/2016 Bob 8 Apples 10/6/2016 Mike 9 Apples 10/7/2016 Steve 10 Apples 10/7/2016 Bob 1 Oranges 10/7/2016 Bob 2 Oranges 10/6/2016 Tom 15 Oranges 10/6/2016 Mike 57 Oranges 10/6/2016 Bob 65 Oranges 10/7/2016 Tony 1...

python pandas dataframe group-by aggregate

200

Разбить (взорвать) строку ввода в панде в кадре данных на отдельные строки

У меня есть, pandas dataframeв котором один столбец текстовых строк содержит значения, разделенные запятыми. Я хочу разделить каждое поле CSV и создать новую строку для каждой записи (предположим, что CSV чисты и должны быть разделены только на ','). Например, aдолжно стать b: In [7]: a Out[7]:...

python pandas numpy dataframe

199

Выберите строки DataFrame между двумя датами

Я создаю DataFrame из CSV следующим образом: stock = pd.read_csv('data_in/' + filename + '.csv', skipinitialspace=True) DataFrame имеет столбец даты. Есть ли способ создать новый DataFrame (или просто перезаписать существующий), который содержит только строки со значениями даты, которые попадают в...

python pandas

198

Обнаружение и исключение выбросов в кадре данных Pandas

У меня есть фрейм данных панд с несколькими столбцами. Теперь я знаю, что определенные строки являются выбросами на основе определенного значения столбца. Например столбец 'Vol' имеет все значения вокруг, 12xxи одно значение 4000(выброс). Теперь я хотел бы исключить те строки, которые имеют...

python pandas filtering dataframe outliers

197

Как разбить столбец на два столбца?

У меня есть фрейм данных с одним столбцом, и я хотел бы разбить его на два столбца, с одним заголовком столбца как ', fips'а другой'row' Мой фрейм данных dfвыглядит так: row 0 00000 UNITED STATES 1 01000 ALABAMA 2 01001 Autauga County, AL 3 01003 Baldwin County, AL 4 01005 Barbour County, AL Я не...

python dataframe pandas

197

Добавьте метки x и y к графику панд

Предположим, у меня есть следующий код, который строит что-то очень простое с помощью панд: import pandas as pd values = [[1, 2], [2, 5]] df2 = pd.DataFrame(values, columns=['Type A', 'Type B'], index=['Index 1', 'Index 2']) df2.plot(lw=2, colormap='jet', marker='.', markersize=10, title='Video...

python pandas dataframe matplotlib

195

Чем отличаются Pandas от NumPy + SciPy в Python? [закрыто]

Закрыто . Этот вопрос основан на мнении . В настоящее время он не принимает ответы. Хотите улучшить этот вопрос? Обновите вопрос, чтобы ответить на него фактами и цитатами, отредактировав этот пост . Закрыто 4 года назад . Улучшить этот вопрос Они оба кажутся чрезвычайно похожими, и мне любопытно,...

python numpy scipy pandas

195

Изменение определенного имени столбца в панде DataFrame

Я искал элегантный способ изменить указанное имя столбца в DataFrame. воспроизводить данные ... import pandas as pd d = { 'one': [1, 2, 3, 4, 5], 'two': [9, 8, 7, 6, 5], 'three': ['a', 'b', 'c', 'd', 'e'] } df = pd.DataFrame(d) Самое элегантное решение, которое я нашел до сих пор ... names =...

python pandas

194

Как мне прочитать большой CSV-файл с пандами?

Я пытаюсь прочитать большой CSV-файл (около 6 ГБ) в пандах, и я получаю ошибку памяти: MemoryError Traceback (most recent call last) <ipython-input-58-67a72687871b> in <module>() ----> 1 data=pd.read_csv('aphro.csv',sep=';') ... MemoryError: Любая помощь в...

python pandas csv memory chunks

191

панда трехстороннее объединение нескольких фреймов данных на столбцах

У меня есть 3 файла CSV. Каждый из них имеет первый столбец в виде (строковых) имен людей, в то время как все остальные столбцы в каждом кадре данных являются атрибутами этого человека. Как я могу «объединить» все три CSV-документа, чтобы создать единый CSV-файл, в котором каждая строка имеет все...

python pandas join merge

190

Python pandas Фильтрация Nan из выборки данных столбца строк

Без использования, groupbyкак бы я отфильтровать данные без NaN? Допустим, у меня есть матрица, в которой клиенты будут заполнять 'N / A', 'N / A' или любой из его вариантов, а другие оставляют это поле пустым: import pandas as pd import numpy as np df = pd.DataFrame({'movie': ['thg', 'thg', 'mol',...

python pandas dataframe