Вопросы с тегом «missing-data»

852
Удалить строки со всеми или некоторыми NA (отсутствующими значениями) в data.frame

Я хотел бы удалить строки в этом фрейме данных, которые: а) содержать NAs во всех столбцах. Ниже мой пример фрейма данных. gene hsap mmul mmus rnor cfam 1 ENSG00000208234 0 NA NA NA NA 2 ENSG00000199674 0 2 2 2 2 3 ENSG00000221622 0 NA NA NA NA 4 ENSG00000207604 0 NA NA 1 2 5 ENSG00000207431 0 NA...

192
Удалить значения NA из вектора

У меня есть огромный вектор, который имеет пару NAзначений, и я пытаюсь найти максимальное значение в этом векторе (вектор это все числа), но я не могу сделать это из-за NAзначений. Как я могу удалить NAзначения, чтобы я мог вычислить...

87
Как сделать строковый столбец pandas dataframe в нижнем регистре, если в нем отсутствуют значения?

Следующий код не работает. import pandas as pd import numpy as np df=pd.DataFrame(['ONE','Two', np.nan],columns=['x']) xLower = df["x"].map(lambda x: x.lower()) Как мне настроить его, чтобы получить xLower = ['one', 'two', np.nan]? Эффективность важна, поскольку реальный фрейм данных огромен....

80
str.format () вызывает KeyError

Следующий код вызывает KeyErrorисключение: addr_list_formatted = [] addr_list_idx = 0 for addr in addr_list: # addr_list is a list addr_list_idx = addr_list_idx + 1 addr_list_formatted.append(""" "{0}" { "gamedir" "str" "address" "{1}" } """.format(addr_list_idx, addr)) Почему? Я использую Python...

80
Элегантный способ сообщить об отсутствующих значениях в data.frame

Вот небольшой фрагмент кода, который я написал для сообщения о переменных с отсутствующими значениями из фрейма данных. Я пытаюсь придумать более элегантный способ сделать это, возможно, вернув data.frame, но я застрял: for (Var in names(airquality)) { missing <- sum(is.na(airquality[,Var])) if...