Вопросы с тегом «dataframe»

80
Элегантный способ сообщить об отсутствующих значениях в data.frame

Вот небольшой фрагмент кода, который я написал для сообщения о переменных с отсутствующими значениями из фрейма данных. Я пытаюсь придумать более элегантный способ сделать это, возможно, вернув data.frame, но я застрял: for (Var in names(airquality)) { missing <- sum(is.na(airquality[,Var])) if...

80
Как распечатать (на бумаге) красиво отформатированный фрейм данных

Я хотел бы напечатать красиво отформатированные фреймы данных на бумаге, в идеале из сценария. (Я пытаюсь собрать данные с помощью инструмента и автоматически обработать и распечатать их с помощью сценария R). Прямо сейчас я могу записать фрейм данных в текстовый файл, используя write.table(), но...

80
Заменить недопустимые значения на None в Pandas DataFrame

Есть ли способ заменить значения Noneв Pandas в Python? Вы можете использовать df.replace('pre', 'post')и можете заменить одно значение другим, но этого нельзя сделать, если вы хотите заменить на Noneзначение, которое при попытке получить странный результат. Итак, вот пример: df =...

80
Удаление / обрезка всех строк фрейма данных

Очистив значения фрейма данных с несколькими типами в python / pandas, я хочу обрезать строки. Сейчас я делаю это по двум инструкциям: import pandas as pd df = pd.DataFrame([[' a ', 10], [' c ', 5]]) df.replace('^\s+', '', regex=True, inplace=True) #front df.replace('\s+$', '', regex=True,...

23
Добавить новый столбец в фрейм данных на основе словаря

У меня есть датафрейм и словарь. Мне нужно добавить новый столбец в фрейм данных и рассчитать его значения на основе словаря. Машинное обучение, добавление новой функции на основе некоторой таблицы: score = {(1, 45, 1, 1) : 4, (0, 1, 2, 1) : 5} df = pd.DataFrame(data = { 'gender' : [1, 1, 0, 1, 1,...

19
Unstack и возвращаемое значение считается для каждой переменной?

У меня есть фрейм данных, в котором записаны ответы людей, выбравших языки программирования 19717 года на вопросы с несколькими вариантами ответов. В первом столбце, конечно, указывается пол респондента, а в остальных - выбор, который они выбрали. И, следовательно, если я выберу Python, мой ответ...

13
Почему назначение с [:] по сравнению с iloc [:] дает разные результаты в пандах?

Я так запутался с различными методами индексации, используемыми ilocв пандах. Допустим, я пытаюсь преобразовать 1-й Dataframe в 2-й Dataframe. Сначала у меня есть следующий 1-й Dataframe a_array = [1,2,3,4,5,6,7,8] a_df = pd.DataFrame(a_array).T И я собираюсь преобразовать это в 2-й Dataframe с...

12
Как поворачивать фрейм данных, состоящий из столбца с разделом и подразделом в R

У меня есть нижеупомянутый фрейм данных: structure( list(ID = c("P-1", " P-1", "P-1", "P-2", "P-3", "P-4", "P-5", "P-6", "P-7", "P-8"), Date = c("2020-03-16 12:11:33", "2020-03-16 13:16:04", "2020-03-16 06:13:55", "2020-03-16 10:03:43", "2020-03-16 12:37:09", "2020-03-16 06:40:24", "2020-03-16...

12
Генерация отфильтрованных бинарных декартовых продуктов

Постановка задачи Я ищу эффективный способ генерирования полных двоичных декартовых продуктов (таблиц со всеми комбинациями True и False с определенным числом столбцов), отфильтрованных по определенным исключительным условиям. Например, для трех столбцов / битов n=3мы получили бы полную таблицу...

11
объединить кадры данных на основе нескольких столбцов и порогов

У меня есть два data.frameS с несколькими общими столбцами (здесь: date, city, ctry, и ( other_) number). Теперь я хотел бы объединить их в приведенных выше столбцах, но допустил бы некоторые различия: threshold.numbers <- 3 threshold.date <- 5 # in days Если разница между dateзаписями...

11
Считать файл повторяющихся пар «ключ = значение» в DataFrame

У меня есть текстовый файл с данными в этом формате. Первые 3 строки повторяются снова и снова. name=1 grade=A class=B name=2 grade=D class=A Я хотел бы вывести данные в виде таблицы, например: name | grade | class 1 | A | B 2 | D | A Я изо всех сил пытаюсь установить заголовки и просто перебрать...

11
Добавить идентификатор, найденный в списке, в новый столбец в панде.

Скажем, у меня есть следующий фрейм данных (столбец целых чисел и столбец со списком целых чисел) ... ID Found_IDs 0 12345 [15443, 15533, 3433] 1 15533 [2234, 16608, 12002, 7654] 2 6789 [43322, 876544, 36789] А также отдельный список идентификаторов ... bad_ids = [15533, 876544, 36789, 11111]...

11
идентифицировать и пометить повторяющиеся строки в r

Я хотел бы идентифицировать и отметить повторяющиеся строки на основе 2 столбцов. Я хотел бы сделать уникальный идентификатор для каждого дубликата, чтобы я знал не только, что строка является дубликатом, но и с какой строкой он является дубликатом. У меня есть датафрейм, который выглядит как...

11
Как удалить нулевые значения из динамического цикла, сгенерированного из Python?

У меня есть фрейм данных, как это: ORDER_NO 2401 2504 2600 2020020 2019-12-04 2019-12-10 2019-12-12 2020024 2019-12-25 NaN 2019-12-20 2020034 NaN NaN 2019-12-20 2020020 2019-12-12 2019-12-15 2019-12-18 Я создаю XML из вышеупомянутого фрейма данных. Я хочу удалить нулевое значение в XML. Мой код...

10
Фильтрация DataFrame по группам, где количество элементов отличается от 1

Я работаю с DataFrame, имеющим следующую структуру: import pandas as pd df = pd.DataFrame({'group':[1,1,1,2,2,2,2,3,3,3], 'brand':['A','B','X','C','D','X','X','E','F','X']}) print(df) group brand 0 1 A 1 1 B 2 1 X 3 2 C 4 2 D 5 2 X 6 2 X 7 3 E 8 3 F 9 3 X Моя цель состоит в том, чтобы просмотреть...