Вопросы с тегом «dataframe»

170
Как распечатать панды DataFrame без индекса

Я хочу напечатать весь фрейм данных, но я не хочу печатать индекс Кроме того, один столбец имеет тип datetime, я просто хочу напечатать время, а не дату. Фрейм данных выглядит так: User ID Enter Time Activity Number 0 123 2014-07-08 00:09:00 1411 1 123 2014-07-08 00:18:00 893 2 123 2014-07-08...

168
Использование Pandas для pd.read_excel () для нескольких листов одной и той же книги

У меня есть большой файл электронной таблицы (.xlsx), который я обрабатываю с помощью Python-панд. Бывает, что мне нужны данные из двух вкладок в этом большом файле. Одна из вкладок содержит массу данных, а другая - всего лишь несколько квадратных ячеек. Когда я использую pd.read_excel () на любом...

168
Вызовите функцию, подобную apply, в каждой строке информационного кадра с несколькими аргументами из каждой строки

У меня есть датафрейм с несколькими столбцами. Для каждой строки в кадре данных я хочу вызвать функцию в строке, и для ввода функции используются несколько столбцов из этой строки. Например, допустим, у меня есть эти данные и этот testFunc, который принимает два аргумента: > df <-...

168
Конвертировать Pandas DataFrame в словарь

У меня есть DataFrame с четырьмя столбцами. Я хочу преобразовать этот DataFrame в словарь Python. Я хочу, чтобы элементы первого столбца были, keysа элементы других столбцов в той же строке были values. DataFrame: ID A B C 0 p 1 3 2 1 q 4 3 2 2 r 4 0 9 Вывод должен быть таким: Словарь: {'p':...

167
Логические операторы для логической индексации в Pandas

Я работаю с логическим индексом в Pandas. Вопрос в том, почему заявление: a[(a['some_column']==some_number) & (a['some_other_column']==some_other_number)] работает нормально, тогда как a[(a['some_column']==some_number) and (a['some_other_column']==some_other_number)] выходит с ошибкой? Пример:...

166
Как отобразить панды DataFrame с плавающей запятой, используя строку формата для столбцов?

Я хотел бы отобразить pandas dataframe с использованием заданного формата print()и IPython display(). Например: df = pd.DataFrame([123.4567, 234.5678, 345.6789, 456.7890], index=['foo','bar','baz','quux'], columns=['cost']) print df cost foo 123.4567 bar 234.5678 baz 345.6789 quux 456.7890 Я хотел...

166
Pandas DataFrame в список словарей

У меня есть следующий DataFrame: клиент item1 item2 item3 1 помидор с яблочным молоком 2 воды апельсиновый картофель 3 сока чипсов манго который я хочу перевести в список словарей в строке rows = [{'customer': 1, 'item1': 'apple', 'item2': 'milk', 'item3': 'tomato'}, {'customer': 2, 'item1':...

164
Изменение формы data.frame из широкого в длинный формат

У меня возникли проблемы с преобразованием моего data.frameиз широкого стола в длинный стол. На данный момент это выглядит так: Code Country 1950 1951 1952 1953 1954 AFG Afghanistan 20,249 21,352 22,532 23,557 24,555 ALB Albania 8,097 8,986 10,058 11,123 12,246 Теперь я хотел бы превратить это...

164
Преобразовать столбец data.frame в вектор?

У меня есть датафрейм, такой как: a1 = c(1, 2, 3, 4, 5) a2 = c(6, 7, 8, 9, 10) a3 = c(11, 12, 13, 14, 15) aframe = data.frame(a1, a2, a3) Я попробовал следующее, чтобы преобразовать один из столбцов в вектор, но это не работает: avector <- as.vector(aframe['a2']) class(avector) [1] "data.frame"...

163
Сравните два DataFrames и выведите их различия бок о бок

Я пытаюсь выделить именно то, что изменилось между двумя кадрами. Предположим, у меня есть два кадра данных Python Pandas: "StudentRoster Jan-1": id Name score isEnrolled Comment 111 Jack 2.17 True He was late to class 112 Nick 1.11 False Graduated 113 Zoe 4.12 True "StudentRoster Jan-2": id Name...

161
Сравните два data.frames, чтобы найти строки в data.frame 1, которых нет в data.frame 2

У меня есть следующие 2 data.frames: a1 <- data.frame(a = 1:5, b=letters[1:5]) a2 <- data.frame(a = 1:3, b=letters[1:3]) Я хочу найти строку a1, которую a2 не имеет. Есть ли встроенная функция для этого типа операции? (ps: я действительно написал решение для этого, мне просто любопытно, если...

160
Добавить новую строку в dataframe, с определенным индексом строки, не добавляется?

Следующий код объединяет вектор с фреймом данных: newrow = c(1:4) existingDF = rbind(existingDF,newrow) Однако этот код всегда вставляет новую строку в конце кадра данных. Как я могу вставить строку в указанной точке в кадре данных? Например, предположим, что в фрейме данных 20 строк, как вставить...

158
Упорядочить строки данных в соответствии с вектором с определенным порядком

Есть ли более простой способ убедиться, что строки фрейма данных упорядочены в соответствии с «целевым» вектором, как я реализовал в коротком примере ниже? df <- data.frame(name = letters[1:4], value = c(rep(TRUE, 2), rep(FALSE, 2))) df # name value # 1 a TRUE # 2 b TRUE # 3 c FALSE # 4 d FALSE...

157
Фильтрация данных по фреймам Pandas по датам

У меня есть Pandas DataFrame со столбцом «дата». Теперь мне нужно отфильтровать все строки в DataFrame с датами за пределами следующих двух месяцев. По сути, мне нужно только сохранить строки, которые находятся в течение следующих двух месяцев. Каков наилучший способ достичь...

156
Превратить Pandas Multi-Index в столбец

У меня есть датафрейм с 2 уровнями индекса: value Trial measurement 1 0 13 1 3 2 4 2 0 NaN 1 12 3 0 34 Который я хочу превратить в это: Trial measurement value 1 0 13 1 1 3 1 2 4 2 0 NaN 2 1 12 3 0 34 Как я могу лучше всего это сделать? Мне это нужно, потому что я хочу агрегировать данные, как...

155
Pandas dataframe fillna () только некоторые столбцы на месте

Я пытаюсь заполнить никакие значения в кадре данных Pandas с 0 только для некоторого подмножества столбцов. Когда я делаю: import pandas as pd df = pd.DataFrame(data={'a':[1,2,3,None],'b':[4,5,None,6],'c':[None,None,7,8]}) print df df.fillna(value=0, inplace=True) print df Выход: a b c 0 1.0 4.0...