Вопросы с тегом «pandas»

190
Python pandas Фильтрация Nan из выборки данных столбца строк

Без использования, groupbyкак бы я отфильтровать данные без NaN? Допустим, у меня есть матрица, в которой клиенты будут заполнять 'N / A', 'N / A' или любой из его вариантов, а другие оставляют это поле пустым: import pandas as pd import numpy as np df = pd.DataFrame({'movie': ['thg', 'thg', 'mol',...

189
Как мне вставить столбец с определенным индексом столбца в пандах?

Могу ли я вставить столбец по определенному индексу столбца в пандах? import pandas as pd df = pd.DataFrame({'l':['a','b','c','d'], 'v':[1,2,1,2]}) df['n'] = 0 Это будет столбец nкак последний столбец df, но разве нет способа сказать, dfчтобы поместить nв...

187
Добавить столбец в dataframe с постоянным значением

У меня есть существующий фрейм данных, который мне нужно добавить дополнительный столбец, который будет содержать одинаковое значение для каждой строки. Существующий df: Date, Open, High, Low, Close 01-01-2015, 565, 600, 400, 450 Новый дф: Name, Date, Open, High, Low, Close abc, 01-01-2015, 565,...

187
Как выполнить итерации по столбцам pandas dataframe для запуска регрессии

Я уверен, что это просто, но как полный новичок в python, у меня возникают проблемы с выяснением, как перебирать переменные в pandasкадре данных и запускать регрессию с каждым. Вот что я делаю: all_data = {} for ticker in ['FIUIX', 'FSAIX', 'FSAVX', 'FSTMX']: all_data[ticker] =...

185
Извлечение определенных выбранных столбцов в новый DataFrame в качестве копии

У меня есть DataFrame pandas с 4 столбцами, и я хочу создать новый DataFrame, который имеет только три столбца. Этот вопрос похож на: Извлечение определенных столбцов из фрейма данных, но для панд не R. Следующий код не работает, выдает ошибку и, безусловно, не является пандасным способом сделать...

184
получить список столбцов данных панд на основе типа данных

Если у меня есть датафрейм со следующими столбцами: 1. NAME object 2. On_Time object 3. On_Budget object 4. %actual_hr float64 5. Baseline Start Date datetime64[ns] 6. Forecast Start Date datetime64[ns] Я хотел бы иметь возможность сказать: вот кадр данных, дать мне список столбцов, которые имеют...

184
Документация по пандам

Таким образом, я полностью понимаю, как использовать resample , но документация не делает хорошую работу, объясняя варианты. Таким образом, большинство параметров в resampleфункции довольно просты за исключением этих двух: правило: строка смещения или объект, представляющий целевое преобразование...

179
Конвертировать столбцы в строку в Pandas

У меня есть следующий DataFrame из запроса SQL: (Pdb) pp total_rows ColumnID RespondentCount 0 -1 2 1 3030096843 1 2 3030096845 1 и я хочу повернуть это так: total_data = total_rows.pivot_table(cols=['ColumnID']) (Pdb) pp total_data ColumnID -1 3030096843 3030096845 RespondentCount 2 1 1 [1 rows x...

177
Получение списка списков в пандах DataFrame

Я читаю содержимое таблицы в панды. DataNitro имеет метод, который возвращает прямоугольный выбор ячеек в виде списка списков. Так table = Cell("A1").table дает table = [['Heading1', 'Heading2'], [1 , 2], [3, 4]] headers = table.pop(0) # gives the headers as list and leaves data Я занят написанием...

177
pandas DataFrame: заменить значения nan на среднее значение столбцов

У меня есть пандас DataFrame, заполненный в основном реальными числами, но в нем также есть несколько nanзначений. Как я могу заменить nanсредние значения столбцов, где они находятся? Этот вопрос очень похож на этот: массив numpy: замените значения nan на среднее значение столбцов, но, к сожалению,...

176
Конвертировать столбец Pandas, содержащий NaN, в dtype `int`

Я читаю данные из файла .csv на фрейм данных Pandas, как показано ниже. Для одного из столбцов, а именно id, я хочу указать тип столбца как int. Проблема в том, что в idсерии отсутствуют / пустые значения. Когда я пытаюсь привести idстолбец к целому числу при чтении .csv, я получаю: df=...

171
панды лок против илок против икс против у против иат?

Недавно начал переходить из моего безопасного места (R) в Python, и меня немного смущает локализация / выборка ячеек в Pandas. Я прочитал документацию, но изо всех сил пытаюсь понять практические последствия различных вариантов локализации / выбора. Есть ли причина , почему я никогда не должен...

170
Как распечатать панды DataFrame без индекса

Я хочу напечатать весь фрейм данных, но я не хочу печатать индекс Кроме того, один столбец имеет тип datetime, я просто хочу напечатать время, а не дату. Фрейм данных выглядит так: User ID Enter Time Activity Number 0 123 2014-07-08 00:09:00 1411 1 123 2014-07-08 00:18:00 893 2 123 2014-07-08...

169
Панды: объединить (объединить) два фрейма данных в нескольких столбцах

Я пытаюсь соединить два фрейма данных панд, используя два столбца: new_df = pd.merge(A_df, B_df, how='left', left_on='[A_c1,c2]', right_on = '[B_c1,c2]') но получил следующую ошибку: pandas/index.pyx in pandas.index.IndexEngine.get_loc (pandas/index.c:4164)() pandas/index.pyx in...