Python - Chuỗi thời gian

Chuỗi thời gian là một chuỗi các điểm dữ liệu trong đó mỗi điểm dữ liệu được liên kết với một dấu thời gian. Một ví dụ đơn giản là giá cổ phiếu trên thị trường chứng khoán tại các thời điểm khác nhau trong một ngày nhất định. Một ví dụ khác là lượng mưa của một vùng vào các tháng khác nhau trong năm.

Trong ví dụ dưới đây, chúng tôi lấy giá trị của giá cổ phiếu hàng ngày trong một quý cho một mã cổ phiếu cụ thể. Chúng tôi nắm bắt các giá trị này dưới dạng tệp csv và sau đó sắp xếp chúng vào khung dữ liệu bằng thư viện gấu trúc. Sau đó, chúng tôi đặt trường ngày làm chỉ mục của khung dữ liệu bằng cách tạo lại cột Giá trị bổ sung làm chỉ mục và xóa cột có giá trị cũ.

Dữ liệu mẫu

Dưới đây là dữ liệu mẫu về giá cổ phiếu vào các ngày khác nhau của một quý nhất định. Dữ liệu được lưu trong một tệp có tên là stock.csv

ValueDate	Price
01-01-2018,	1042.05
02-01-2018,	1033.55
03-01-2018,	1029.7
04-01-2018,	1021.3
05-01-2018,	1015.4
...
...
...
...
23-03-2018,	1161.3
26-03-2018,	1167.6
27-03-2018,	1155.25
28-03-2018,	1154

Tạo chuỗi thời gian

from datetime import datetime
import pandas as pd
import matplotlib.pyplot as plt

data = pd.read_csv('path_to_file/stock.csv')
df = pd.DataFrame(data, columns = ['ValueDate', 'Price'])

# Set the Date as Index
df['ValueDate'] = pd.to_datetime(df['ValueDate'])
df.index = df['ValueDate']
del df['ValueDate']


df.plot(figsize=(15, 6))
plt.show()

Nó là output như sau -