Разница между as.POSIXct / as.POSIXlt и strptime для преобразования векторов символов в POSIXct / POSIXlt

95

Я ответил на ряд вопросов, касающихся того, как преобразовать векторы символов в классы datetime. Я часто вижу 2 метода: strptime и as.POSIXct / as.POSIXlt. Я посмотрел на 2 функции, но не понимаю, в чем разница.

strptime

function (x, format, tz = "") 
{
    y <- .Internal(strptime(as.character(x), format, tz))
    names(y$year) <- names(x)
    y
}
<bytecode: 0x045fcea8>
<environment: namespace:base>

as.POSIXct

function (x, tz = "", ...) 
UseMethod("as.POSIXct")
<bytecode: 0x069efeb8>
<environment: namespace:base>

as.POSIXlt

function (x, tz = "", ...) 
UseMethod("as.POSIXlt")
<bytecode: 0x03ac029c>
<environment: namespace:base>

Выполнение микробенчмарка, чтобы увидеть, есть ли различия в производительности:

library(microbenchmark)
Dates <- sample(c(dates = format(seq(ISOdate(2010,1,1), by='day', length=365), format='%d-%m-%Y')), 5000, replace = TRUE)
df <- microbenchmark(strptime(Dates, "%d-%m-%Y"), as.POSIXlt(Dates, format = "%d-%m-%Y"), times = 1000)

Unit: milliseconds
                                    expr      min       lq   median       uq      max
1 as.POSIXlt(Dates, format = "%d-%m-%Y") 32.38596 33.81324 34.78487 35.52183 61.80171
2            strptime(Dates, "%d-%m-%Y") 31.73224 33.22964 34.20407 34.88167 52.12422

strptime кажется немного быстрее. так что дает? почему должно быть 2 похожие функции или есть различия между ними, которые я пропустил?

RJ-
источник
4
Если вы хотите увидеть, какой код вызывается при вызове as.POSIXctи as.POSIXltдля символьных векторов, посмотрите as.POSIXct.defaultи as.POSIXlt.characterсоответственно.
Джошуа Ульрих

Ответы:

155

Что ж, функции делают разные вещи.

Во-первых, есть две внутренние реализации даты / времени:, POSIXctкоторый хранит секунды с эпохи UNIX (+ некоторые другие данные), и POSIXltкоторый хранит список дня, месяца, года, часа, минуты, секунды и т. Д.

strptime- это функция для прямого преобразования векторов символов (различных форматов) в POSIXltформат.

as.POSIXltпреобразует различные типы данных в POSIXlt. Он пытается быть умным и делать разумные вещи - в случае с характером он действует как обертка strptime.

as.POSIXctпреобразует различные типы данных в POSIXct. Он также пытается быть умным и поступать разумно - в случае с персонажем он strptimeсначала запускается , а затем выполняет преобразование из POSIXltв POSIXct.

Имеет смысл, что strptimeэто быстрее, потому что strptimeобрабатывает только ввод символов, в то время как другие пытаются определить, какой метод использовать из типа ввода. Это также должно быть немного безопаснее, так как получение неожиданных данных просто приведет к ошибке, вместо того, чтобы пытаться сделать разумную вещь, которая может быть не тем, что вы хотите.

Фнузоаг
источник
отличный ответ. есть ли консенсус в отношении наилучшей практики сбора данных для моделирования или визуализации данных?
dre
23

Существует два типа POSIXt: POSIXct и POSIXlt. «ct» может обозначать календарное время, в нем хранится количество секунд с момента начала отсчета. «lt», или местное время, сохраняет дату в виде списка атрибутов времени (например, «час» и «пн»). Попробуйте эти примеры:

date.hour=strptime("2011-03-27 01:30:00", "%Y-%m-%d %H:%M:%S")

date=c("26/10/2016")

time=c("19:51:30")

day<-paste(date,"T", time)

day.time1=as.POSIXct(day,format="%d/%m/%Y T %H:%M:%S",tz="Europe/Paris")

day.time1

day.time1$year

day.time2=as.POSIXlt(day,format="%d/%m/%Y T %H:%M:%S",tz="Europe/Paris")

day.time2

day.time2$year
Куонг
источник