Làm cách nào để phân tích cú pháp '2020-07-30T20: 40: 33.1000000Z' bằng datetime.strptime

Aug 17 2020

Tôi đang cố gắng phân tích cú pháp và chuyển đổi "2020-07-30T20: 40: 33.1000000Z" bằng Python:

from datetime import datetime

Data = [{'id': 'XXXXXXXXXXXXX', 'number': 3, 'externalId': '0000', 'dateCreated': '2020-07-30T20:40:33.1005865Z', 'dateUpdated': '2020-07-30T20:40:33.36Z'}], 'tags': []}]
for i in Data:
        creationtime= datetime.strptime(i["dateCreated"],"%Y-%m-%dT%H:%M:%S")

Lỗi:

    raise ValueError("unconverted data remains: %s" %
ValueError: unconverted data remains: .1005865Z

Tôi đã thử:

%Y-%m-%dT%H:%M:%S.%fZ

Bất cứ ai có thể vui lòng đề xuất định dạng chính xác mà tôi đang thiếu.

Trả lời

2 MrFuppes Aug 17 2020 at 09:13

nếu bạn thực sự có 7 chữ số thập phân của giây phân số và không quan tâm đến 1/10 micro giây , bạn có thể sử dụng a re.subdatetime.fromisoformat:

import re
from datetime import datetime 

s = "2020-07-30T20:40:33.1000000Z"
dt = datetime.fromisoformat(re.sub('[0-9]Z', '+00:00', s))

print(dt)
print(repr(dt))
2020-07-30 20:40:33.100000+00:00
datetime.datetime(2020, 7, 30, 20, 40, 33, 100000, tzinfo=datetime.timezone.utc)

... hoặc sử dụng dateutiltrình phân tích cú pháp của:

from dateutil import parser
dt = parser.parse(s)

print(dt)
print(repr(dt))
2020-07-30 20:40:33.100000+00:00
datetime.datetime(2020, 7, 30, 20, 40, 33, 100000, tzinfo=tzutc())

... hoặc thậm chí pandaslà to_datetime, nếu bạn vẫn có thể làm việc với lib đó:

import pandas as pd
dt = pd.to_datetime(s)

print(dt)
print(repr(dt))
2020-07-30 20:40:33.100000+00:00
Timestamp('2020-07-30 20:40:33.100000+0000', tz='UTC')

thường không liên quan (tùy thuộc vào trường hợp sử dụng) nhưng lưu ý rằng sự tiện lợi sẽ khiến bạn mất thêm thời gian:

%timeit datetime.fromisoformat(re.sub('[0-9]Z', '+00:00', s))
1.92 µs ± 151 ns per loop (mean ± std. dev. of 7 runs, 1000000 loops each)

%timeit parser.parse(s)
79.8 µs ± 3.46 µs per loop (mean ± std. dev. of 7 runs, 10000 loops each)

%timeit pd.to_datetime(s)
62.4 µs ± 1.17 µs per loop (mean ± std. dev. of 7 runs, 10000 loops each)