В R, когда вам нужно получить индекс столбца на основе имени столбца, вы можете сделать
idx <- which(names(my_data)==my_colum_name)
Есть ли способ сделать то же самое с панелями данных?
Конечно, вы можете использовать .get_loc()
:
In [45]: df = DataFrame({"pear": [1,2,3], "apple": [2,3,4], "orange": [3,4,5]})
In [46]: df.columns
Out[46]: Index([apple, orange, pear], dtype=object)
In [47]: df.columns.get_loc("pear")
Out[47]: 2
хотя, если честно, мне это часто не нужно. Обычно доступ по имени делает то , что я хочу его ( df["pear"]
, df[["apple", "orange"]]
или , может быть df.columns.isin(["orange", "pear"])
), хотя я могу определенно видеть случаи , когда вы хотите , индексный номер.
.iloc
оператора, где вы должны передавать только целые числа как для строк, так и для столбцов.insert
новый столбец после существующего столбца.Вот решение через понимание списка. cols - список столбцов, для которых нужно получить индекс:
источник
cols
имеет меньше элементов, чемdf.columns
делать,for c in cols if c in df
это будет быстрее.Решение DSM работает, но если вы хотите получить прямой эквивалент,
which
вы можете сделать(df.columns == name).nonzero()
источник
Если вы хотите найти совпадения нескольких столбцов, можно использовать
searchsorted
метод векторизованного решения . Таким образом, при использованииdf
в качестве информационного кадра иquery_cols
имен столбцов для поиска реализация будетПробный прогон -
источник
Если вам нужно имя столбца из местоположения столбца (наоборот, к вопросу OP), вы можете использовать:
Используя пример @DSM:
Другие способы:
источник
df.columns[location]
?как насчет этого:
источник