Как преобразовать столбец фрейма данных в числовой тип?
источник
Как преобразовать столбец фрейма данных в числовой тип?
Поскольку (все еще) никто не ставил галочку, я предполагаю, что вы имеете в виду некоторые практические проблемы, в основном потому, что вы не указали, в какой тип вектора вы хотите преобразовать numeric
. Я предлагаю вам применить transform
функцию, чтобы выполнить свою задачу.
Теперь я собираюсь продемонстрировать определенную «аномалию конверсии»:
# create dummy data.frame
d <- data.frame(char = letters[1:5],
fake_char = as.character(1:5),
fac = factor(1:5),
char_fac = factor(letters[1:5]),
num = 1:5, stringsAsFactors = FALSE)
Давайте взглянем на data.frame
> d
char fake_char fac char_fac num
1 a 1 1 a 1
2 b 2 2 b 2
3 c 3 3 c 3
4 d 4 4 d 4
5 e 5 5 e 5
и давай побежим
> sapply(d, mode)
char fake_char fac char_fac num
"character" "character" "numeric" "numeric" "numeric"
> sapply(d, class)
char fake_char fac char_fac num
"character" "character" "factor" "factor" "integer"
Теперь вы, вероятно, спросите себя: "Где аномалия?" Ну, я наткнулся на довольно своеобразных вещи в R, и это не самым путая вещь, но это может сбить вас с толку, особенно если вы читаете это перед прокаткой в постель.
Здесь идет: первые два столбца character
. Я намеренно назвал 2 - й один fake_char
. Найдите сходство этой character
переменной с той, которую Дирк создал в своем ответе. Это на самом деле numerical
вектор преобразован в character
. 3- й и 4- й столбцы factor
, а последний «чисто» numeric
.
Если вы используете transform
функцию, вы можете преобразовать fake_char
в numeric
, но не в char
саму переменную.
> transform(d, char = as.numeric(char))
char fake_char fac char_fac num
1 NA 1 1 a 1
2 NA 2 2 b 2
3 NA 3 3 c 3
4 NA 4 4 d 4
5 NA 5 5 e 5
Warning message:
In eval(expr, envir, enclos) : NAs introduced by coercion
но если вы сделаете одно и то же, fake_char
и char_fac
вам повезет, и вы получите без NA:
> transform(d, fake_char = as.numeric(fake_char),
char_fac = as.numeric(char_fac))
char fake_char fac char_fac num
1 a 1 1 1 1
2 b 2 2 2 2
3 c 3 3 3 3
4 d 4 4 4 4
5 e 5 5 5 5
Если вы сохраните преобразованный data.frame
и проверьте mode
и class
, вы получите:
> D <- transform(d, fake_char = as.numeric(fake_char),
char_fac = as.numeric(char_fac))
> sapply(D, mode)
char fake_char fac char_fac num
"character" "numeric" "numeric" "numeric" "numeric"
> sapply(D, class)
char fake_char fac char_fac num
"character" "numeric" "factor" "numeric" "integer"
Итак, вывод такой: да, вы можете конвертировать character
вектор в numeric
единицу, но только если его элементы «конвертируемы» в numeric
. Если character
в векторе только один элемент, вы получите ошибку при попытке преобразовать этот вектор в numerical
один.
И просто чтобы доказать мою точку зрения:
> err <- c(1, "b", 3, 4, "e")
> mode(err)
[1] "character"
> class(err)
[1] "character"
> char <- as.numeric(err)
Warning message:
NAs introduced by coercion
> char
[1] 1 NA 3 4 NA
А теперь, просто для развлечения (или практики), попробуйте угадать вывод этих команд:
> fac <- as.factor(err)
> fac
???
> num <- as.numeric(fac)
> num
???
С уважением, Патрик Бернс! знак равно
Что-то, что мне помогло: если у вас есть диапазоны переменных для преобразования (или просто более одной), вы можете использовать
sapply
.Немного бессмысленно, но только для примера:
Скажем, столбцы 3, 6-15 и 37 вашего информационного кадра необходимо преобразовать в числовой, который можно:
источник
sapply
вызовas.data.frame()
с правой стороны, как @Mehrad Mahmoudian предложил ниже, он будет работать.Если
x
это имя столбца dataframedat
иx
имеет тип-фактор, используйте:источник
as.character
действительно то, что я искал. В противном случае преобразование иногда идет не так. По крайней мере, в моем случае.Error: (list) object cannot be coerced to type 'double'
хотя я был достаточно уверен, что в моем векторе нет символов / знаков препинания. Затем я попытался,as.numeric(as.character(dat$x))
и это сработало. Теперь я не уверен, является ли мой столбец целыми числами или нет!Я бы добавил комментарий (не могу низкий рейтинг)
Просто добавить на user276042 и pangratz
Это переопределит значения существующего столбца х
источник
В то время как ваш вопрос строго о числовых значениях, есть много преобразований, которые трудно понять при начале R. Я постараюсь обратиться к методам, чтобы помочь. Этот вопрос похож на этот вопрос .
Преобразование типов может быть проблемой в R, потому что (1) факторы не могут быть преобразованы непосредственно в числовые, их нужно сначала преобразовать в класс символов, (2) даты представляют собой особый случай, с которым вам обычно приходится иметь дело отдельно, и (3) цикл по столбцам данных может быть сложным. К счастью, «Tidyverse» решил большинство проблем.
Это решение использует
mutate_each()
для применения функции ко всем столбцам в фрейме данных. В этом случае мы хотим применитьtype.convert()
функцию, которая преобразует строки в числовые, где это возможно. Поскольку R любит факторы (не знаю почему), столбцы символов, которые должны оставаться символами, меняются на фактор. Чтобы исправить это,mutate_if()
функция используется для обнаружения столбцов, которые являются факторами и переходят в символьные. Наконец, я хотел показать, как lubridate можно использовать для изменения метки времени в классе символов на дату-время, потому что это также часто является препятствующим блоком для начинающих.источник
mutate_all(type.convert, as.is=TRUE)
вместоmutate_all(type.convert)
, вы можете удалить / избежать,mutate_if(is.factor, as.character)
чтобы сократить команду.as.is
является аргументом,type.convert()
который указывает, следует ли преобразовывать строки как символы или как факторы. По умолчаниюas.is=FALSE
вtype.convert()
(т. Е. Преобразует строки в фактор-класс вместо символьного класса).Тим прав, а у Шейна упущение. Вот дополнительные примеры:
Наша
data.frame
теперь сводка колонки фактора (имп) и числовые краткой информации оas.numeric()
--- , который не так , как он получил цифровые уровни фактора --- и (правильное) резюмеas.numeric(as.character())
.источник
С помощью следующего кода вы можете преобразовать все столбцы фрейма данных в числовые (X - фрейм данных, в который мы хотим преобразовать его столбцы):
и для преобразования всей матрицы в числовой у вас есть два способа: Либо:
или:
В качестве альтернативы вы можете использовать
data.matrix
функцию для преобразования всего в числовое значение, хотя имейте в виду, что факторы могут преобразовываться неправильно, поэтому безопаснее преобразовать все вcharacter
первое:Я обычно использую этот последний, если я хочу преобразовать в матрицу и число одновременно
источник
Если у вас возникли проблемы с:
Посмотрите на ваши десятичные знаки. Если они "," вместо "." (например, «5,3») выше не будет работать.
Потенциальное решение:
Я считаю, что это довольно распространено в некоторых не англоязычных странах.
источник
Универсальный способ использования
type.convert()
иrapply()
:источник
as.is = TRUE
если вы хотите преобразовать вашего персонажа в числовые или в коэффициентыmatrix
с числовыми изменениями,classes=matrix
ошибочный первый аргумент должен иметь символ режимаЧтобы преобразовать столбец фрейма данных в числовой, вам просто нужно сделать: -
коэффициент к числовому: -
источник
sapply(data_frame,function(x) as.numeric(as.character(x)))
Хотя другие довольно хорошо освещали эту тему, я хотел бы добавить эту дополнительную мысль / подсказку. Вы можете использовать регулярное выражение, чтобы заранее проверить, могут ли символы состоять только из цифр.
Для более сложных регулярных выражений и ясной причины, чтобы узнать / испытать их силу, посмотрите этот действительно хороший сайт: http://regexr.com/
источник
Учитывая, что могут существовать столбцы с символами, это основано на @Abdou в разделе Получить типы столбцов таблицы Excel, который автоматически отвечает:
источник
В моем ПК (R v.3.2.3)
apply
илиsapply
выдают ошибку.lapply
работает хорошо.источник
Если в кадре данных есть несколько типов столбцов, некоторые символы, некоторые числовые, попробуйте следующее, чтобы преобразовать только столбцы, содержащие числовые значения, в числовые:
источник
с hablar :: convert
Чтобы легко преобразовать несколько столбцов в разные типы данных, вы можете использовать
hablar::convert
. Простой синтаксис:df %>% convert(num(a))
преобразовывает столбец a из df в числовой.Подробный пример
Позволяет преобразовать все столбцы
mtcars
в символ.С
hablar::convert
:результаты в:
источник
Чтобы преобразовать символ в число, вы должны преобразовать его в коэффициент, применив
Вы должны сделать два столбца с одинаковыми данными, потому что один столбец не может быть преобразован в числовой. Если вы делаете одно преобразование, это дает ошибку ниже
Итак, после выполнения двух столбцов одни и те же данные применяются
он преобразует символ в числовой успешно
источник
df
это ваш фрейм данных.x
столбецdf
вы хотите конвертироватьисточник
Если вы не заботитесь о сохранении факторов и хотите применить его к любому столбцу, который можно преобразовать в числовой, я воспользовался приведенным ниже сценарием. если df - ваш оригинальный фрейм данных, вы можете использовать скрипт ниже.
Я ссылался на решение Шейна и Джорана, кстати
источник