Конвертировать тип столбца DataFrame из строки в дату и время, формат дд / мм / гггг

Ответы:

476

Самый простой способ - использовать to_datetime:

df['col'] = pd.to_datetime(df['col'])

Это также предлагает dayfirstаргумент для европейских времен (но будьте осторожны, это не строгое ).

Вот оно в действии:

In [11]: pd.to_datetime(pd.Series(['05/23/2005']))
Out[11]:
0   2005-05-23 00:00:00
dtype: datetime64[ns]

Вы можете передать определенный формат :

In [12]: pd.to_datetime(pd.Series(['05/23/2005']), format="%m/%d/%Y")
Out[12]:
0   2005-05-23
dtype: datetime64[ns]
Энди Хейден
источник
спасибо за ваше воспроизведение, я могу определить его формат? как "% d /% m /% Y"? очень ценится
перигей
2
@shootingstars, возможно, см. stackoverflow.com/questions/13703720/…
Энди Хейден,
1
@shootingstars, передающий массив, DatetimeIndex(df['col']).to_pydatetime()должен работать.
Энди Хейден
1
НВМ, я прокомментировал слишком рано. Поиски SettingWithCopyWarningдают достаточно материала
Sundeep
2
Двойные скобки @daneshjai создают DataFrame (с одним столбцом) по сравнению с одиночными скобками, который получает столбец как серию.
Энди Хейден,
36

Если ваш столбец даты представляет собой строку формата «2017-01-01», вы можете использовать pandas astype, чтобы преобразовать его в дату и время.

df['date'] = df['date'].astype('datetime64[ns]')

или используйте datetime64 [D], если вы хотите использовать точность Day, а не наносекунды

print(type(df_launath['date'].iloc[0]))

доходность

<class 'pandas._libs.tslib.Timestamp'> так же, как при использовании pandas.to_datetime

Вы можете попробовать его в других форматах, кроме "% Y-% m-% d", но по крайней мере это работает.

sigurdb
источник
2

Если у вас есть разные форматы даты, не забудьте установить, infer_datetime_format=Trueчтобы сделать жизнь проще

df['date'] = pd.to_datetime(df['date'], infer_datetime_format=True)

Источник: pd.to_datetime

или если вы хотите индивидуальный подход:

def autoconvert_datetime(value):
    formats = ['%m/%d/%Y', '%m-%d-%y']  # formats to try
    result_format = '%d-%m-%Y'  # output format
    for dt_format in formats:
        try:
            dt_obj = datetime.strptime(value, dt_format)
            return dt_obj.strftime(result_format)
        except Exception as e:  # throws exception when format doesn't match
            pass
    return value  # let it be if it doesn't match

df['date'] = df['date'].apply(autoconvert_datetime)
abhyudayasrinet
источник