У меня есть Pandas Dataframe, как показано ниже: 1 2 3 0 a NaN read 1 b l unread 2 c NaN read Я хочу удалить значения NaN с пустой строкой, чтобы это выглядело так: 1 2 3 0 a "" read 1 b l unread 2 c "" read...
У меня есть Pandas Dataframe, как показано ниже: 1 2 3 0 a NaN read 1 b l unread 2 c NaN read Я хочу удалить значения NaN с пустой строкой, чтобы это выглядело так: 1 2 3 0 a "" read 1 b l unread 2 c "" read...
Я пытаюсь использовать scikit-learn's LabelEncoderдля кодирования панд DataFrameстроковых меток. Поскольку в фрейме данных есть много (более 50) столбцов, я хочу избежать создания LabelEncoderобъекта для каждого столбца; Я бы предпочел просто иметь один большой LabelEncoderобъект, который работает...
Как это сделать в пандах: У меня есть функция extract_text_featuresдля одного текстового столбца, возвращающая несколько выходных столбцов. В частности, функция возвращает 6 значений. Функция работает, однако, похоже, не существует какого-либо правильного возвращаемого типа (pandas DataFrame /...
Я преобразовал pandas dataframe в вывод html, используя DataFrame.to_htmlфункцию. Когда я сохраняю это в отдельный HTML-файл, файл показывает усеченный вывод. Например, в моей колонке ТЕКСТ, df.head(1) покажет Фильм был отличным усилием ... вместо того Фильм был отличным усилием в деконструкции...
У меня есть фрейм данных панд, который выглядит следующим образом (это довольно большой) date exer exp ifor mat 1092 2014-03-17 American M 528.205 2014-04-19 1093 2014-03-17 American M 528.205 2014-04-19 1094 2014-03-17 American M 528.205 2014-04-19 1095 2014-03-17 American M 528.205 2014-04-19...
У меня есть набор данных с огромным количеством функций, поэтому анализ матрицы корреляции стал очень трудным. Я хочу построить корреляционную матрицу, которую мы получаем, используя dataframe.corr()функцию из библиотеки панд. Есть ли встроенная функция, предоставляемая библиотекой панд для...
Можно ли добавить пустой фрейм данных, который не содержит индексов или столбцов? Я пытался сделать это, но продолжаю получать пустой фрейм данных в конце. например df = pd.DataFrame() data = ['some kind of data here' --> I have checked the type already, and it is a dataframe] df.append(data)...
Как найти строку, для которой значение определенного столбца является максимальным ? df.max() даст мне максимальное значение для каждого столбца, я не знаю, как получить соответствующую...
Предположим, у меня есть два DataFrames, например, так: left = pd.DataFrame({'key1': ['foo', 'bar'], 'lval': [1, 2]}) right = pd.DataFrame({'key2': ['foo', 'bar'], 'rval': [4, 5]}) Я хочу объединить их, поэтому я пытаюсь что-то вроде этого: pd.merge(left, right, left_on='key1', right_on='key2') И я...
Я использую этот фрейм данных: Fruit Date Name Number Apples 10/6/2016 Bob 7 Apples 10/6/2016 Bob 8 Apples 10/6/2016 Mike 9 Apples 10/7/2016 Steve 10 Apples 10/7/2016 Bob 1 Oranges 10/7/2016 Bob 2 Oranges 10/6/2016 Tom 15 Oranges 10/6/2016 Mike 57 Oranges 10/6/2016 Bob 65 Oranges 10/7/2016 Tony 1...
У меня есть, pandas dataframeв котором один столбец текстовых строк содержит значения, разделенные запятыми. Я хочу разделить каждое поле CSV и создать новую строку для каждой записи (предположим, что CSV чисты и должны быть разделены только на ','). Например, aдолжно стать b: In [7]: a Out[7]:...
Я создаю DataFrame из CSV следующим образом: stock = pd.read_csv('data_in/' + filename + '.csv', skipinitialspace=True) DataFrame имеет столбец даты. Есть ли способ создать новый DataFrame (или просто перезаписать существующий), который содержит только строки со значениями даты, которые попадают в...
У меня есть фрейм данных панд с несколькими столбцами. Теперь я знаю, что определенные строки являются выбросами на основе определенного значения столбца. Например столбец 'Vol' имеет все значения вокруг, 12xxи одно значение 4000(выброс). Теперь я хотел бы исключить те строки, которые имеют...
У меня есть фрейм данных с одним столбцом, и я хотел бы разбить его на два столбца, с одним заголовком столбца как ', fips'а другой'row' Мой фрейм данных dfвыглядит так: row 0 00000 UNITED STATES 1 01000 ALABAMA 2 01001 Autauga County, AL 3 01003 Baldwin County, AL 4 01005 Barbour County, AL Я не...
Предположим, у меня есть следующий код, который строит что-то очень простое с помощью панд: import pandas as pd values = [[1, 2], [2, 5]] df2 = pd.DataFrame(values, columns=['Type A', 'Type B'], index=['Index 1', 'Index 2']) df2.plot(lw=2, colormap='jet', marker='.', markersize=10, title='Video...
Закрыто . Этот вопрос основан на мнении . В настоящее время он не принимает ответы. Хотите улучшить этот вопрос? Обновите вопрос, чтобы ответить на него фактами и цитатами, отредактировав этот пост . Закрыто 4 года назад . Улучшить этот вопрос Они оба кажутся чрезвычайно похожими, и мне любопытно,...
Я искал элегантный способ изменить указанное имя столбца в DataFrame. воспроизводить данные ... import pandas as pd d = { 'one': [1, 2, 3, 4, 5], 'two': [9, 8, 7, 6, 5], 'three': ['a', 'b', 'c', 'd', 'e'] } df = pd.DataFrame(d) Самое элегантное решение, которое я нашел до сих пор ... names =...
Я пытаюсь прочитать большой CSV-файл (около 6 ГБ) в пандах, и я получаю ошибку памяти: MemoryError Traceback (most recent call last) <ipython-input-58-67a72687871b> in <module>() ----> 1 data=pd.read_csv('aphro.csv',sep=';') ... MemoryError: Любая помощь в...
У меня есть 3 файла CSV. Каждый из них имеет первый столбец в виде (строковых) имен людей, в то время как все остальные столбцы в каждом кадре данных являются атрибутами этого человека. Как я могу «объединить» все три CSV-документа, чтобы создать единый CSV-файл, в котором каждая строка имеет все...
Без использования, groupbyкак бы я отфильтровать данные без NaN? Допустим, у меня есть матрица, в которой клиенты будут заполнять 'N / A', 'N / A' или любой из его вариантов, а другие оставляют это поле пустым: import pandas as pd import numpy as np df = pd.DataFrame({'movie': ['thg', 'thg', 'mol',...