Вопросы с тегом «pandas»

218
Кодирование меток в нескольких столбцах в scikit-learn

Я пытаюсь использовать scikit-learn's LabelEncoderдля кодирования панд DataFrameстроковых меток. Поскольку в фрейме данных есть много (более 50) столбцов, я хочу избежать создания LabelEncoderобъекта для каждого столбца; Я бы предпочел просто иметь один большой LabelEncoderобъект, который работает...

216
Применить функцию панды к столбцу, чтобы создать несколько новых столбцов?

Как это сделать в пандах: У меня есть функция extract_text_featuresдля одного текстового столбца, возвращающая несколько выходных столбцов. В частности, функция возвращает 6 значений. Функция работает, однако, похоже, не существует какого-либо правильного возвращаемого типа (pandas DataFrame /...

214
Как отобразить полную (не усеченную) информацию о фрейме данных в html при конвертации из фрейма данных pandas в html?

Я преобразовал pandas dataframe в вывод html, используя DataFrame.to_htmlфункцию. Когда я сохраняю это в отдельный HTML-файл, файл показывает усеченный вывод. Например, в моей колонке ТЕКСТ, df.head(1) покажет Фильм был отличным усилием ... вместо того Фильм был отличным усилием в деконструкции...

214
Обновите фрейм данных в пандах, повторяя построчно

У меня есть фрейм данных панд, который выглядит следующим образом (это довольно большой) date exer exp ifor mat 1092 2014-03-17 American M 528.205 2014-04-19 1093 2014-03-17 American M 528.205 2014-04-19 1094 2014-03-17 American M 528.205 2014-04-19 1095 2014-03-17 American M 528.205 2014-04-19...

212
Матрица корреляции участков с использованием панд

У меня есть набор данных с огромным количеством функций, поэтому анализ матрицы корреляции стал очень трудным. Я хочу построить корреляционную матрицу, которую мы получаем, используя dataframe.corr()функцию из библиотеки панд. Есть ли встроенная функция, предоставляемая библиотекой панд для...

212
Присоединяешься к пустому DataFrame в Pandas?

Можно ли добавить пустой фрейм данных, который не содержит индексов или столбцов? Я пытался сделать это, но продолжаю получать пустой фрейм данных в конце. например df = pd.DataFrame() data = ['some kind of data here' --> I have checked the type already, and it is a dataframe] df.append(data)...

208
В чем разница между объединением и слиянием в пандах?

Предположим, у меня есть два DataFrames, например, так: left = pd.DataFrame({'key1': ['foo', 'bar'], 'lval': [1, 2]}) right = pd.DataFrame({'key2': ['foo', 'bar'], 'rval': [4, 5]}) Я хочу объединить их, поэтому я пытаюсь что-то вроде этого: pd.merge(left, right, left_on='key1', right_on='key2') И я...

200
Разбить (взорвать) строку ввода в панде в кадре данных на отдельные строки

У меня есть, pandas dataframeв котором один столбец текстовых строк содержит значения, разделенные запятыми. Я хочу разделить каждое поле CSV и создать новую строку для каждой записи (предположим, что CSV чисты и должны быть разделены только на ','). Например, aдолжно стать b: In [7]: a Out[7]:...

199
Выберите строки DataFrame между двумя датами

Я создаю DataFrame из CSV следующим образом: stock = pd.read_csv('data_in/' + filename + '.csv', skipinitialspace=True) DataFrame имеет столбец даты. Есть ли способ создать новый DataFrame (или просто перезаписать существующий), который содержит только строки со значениями даты, которые попадают в...

198
Обнаружение и исключение выбросов в кадре данных Pandas

У меня есть фрейм данных панд с несколькими столбцами. Теперь я знаю, что определенные строки являются выбросами на основе определенного значения столбца. Например столбец 'Vol' имеет все значения вокруг, 12xxи одно значение 4000(выброс). Теперь я хотел бы исключить те строки, которые имеют...

197
Как разбить столбец на два столбца?

У меня есть фрейм данных с одним столбцом, и я хотел бы разбить его на два столбца, с одним заголовком столбца как ', fips'а другой'row' Мой фрейм данных dfвыглядит так: row 0 00000 UNITED STATES 1 01000 ALABAMA 2 01001 Autauga County, AL 3 01003 Baldwin County, AL 4 01005 Barbour County, AL Я не...

197
Добавьте метки x и y к графику панд

Предположим, у меня есть следующий код, который строит что-то очень простое с помощью панд: import pandas as pd values = [[1, 2], [2, 5]] df2 = pd.DataFrame(values, columns=['Type A', 'Type B'], index=['Index 1', 'Index 2']) df2.plot(lw=2, colormap='jet', marker='.', markersize=10, title='Video...

195
Чем отличаются Pandas от NumPy + SciPy в Python? [закрыто]

Закрыто . Этот вопрос основан на мнении . В настоящее время он не принимает ответы. Хотите улучшить этот вопрос? Обновите вопрос, чтобы ответить на него фактами и цитатами, отредактировав этот пост . Закрыто 4 года назад . Улучшить этот вопрос Они оба кажутся чрезвычайно похожими, и мне любопытно,...

195
Изменение определенного имени столбца в панде DataFrame

Я искал элегантный способ изменить указанное имя столбца в DataFrame. воспроизводить данные ... import pandas as pd d = { 'one': [1, 2, 3, 4, 5], 'two': [9, 8, 7, 6, 5], 'three': ['a', 'b', 'c', 'd', 'e'] } df = pd.DataFrame(d) Самое элегантное решение, которое я нашел до сих пор ... names =...

191
панда трехстороннее объединение нескольких фреймов данных на столбцах

У меня есть 3 файла CSV. Каждый из них имеет первый столбец в виде (строковых) имен людей, в то время как все остальные столбцы в каждом кадре данных являются атрибутами этого человека. Как я могу «объединить» все три CSV-документа, чтобы создать единый CSV-файл, в котором каждая строка имеет все...

190
Python pandas Фильтрация Nan из выборки данных столбца строк

Без использования, groupbyкак бы я отфильтровать данные без NaN? Допустим, у меня есть матрица, в которой клиенты будут заполнять 'N / A', 'N / A' или любой из его вариантов, а другие оставляют это поле пустым: import pandas as pd import numpy as np df = pd.DataFrame({'movie': ['thg', 'thg', 'mol',...