Chuỗi thời gian - Hiệu chuẩn tham số
Giới thiệu
Bất kỳ mô hình thống kê hoặc máy học nào cũng có một số tham số ảnh hưởng lớn đến cách dữ liệu được mô hình hóa. Ví dụ, ARIMA có các giá trị p, d, q. Các tham số này phải được quyết định sao cho sai số giữa giá trị thực và giá trị được mô hình hóa là nhỏ nhất. Hiệu chuẩn thông số được cho là công việc quan trọng và tốn thời gian nhất của việc lắp mô hình. Do đó, chúng tôi rất cần thiết để chọn các thông số tối ưu.
Phương pháp hiệu chuẩn các tham số
Có nhiều cách khác nhau để hiệu chỉnh các thông số. Phần này nói về một số chi tiết trong số chúng.
Đánh và thử
Một cách phổ biến để hiệu chỉnh mô hình là hiệu chuẩn bằng tay, trong đó bạn bắt đầu bằng cách hình dung chuỗi thời gian và thử trực quan một số giá trị tham số và thay đổi chúng nhiều lần cho đến khi bạn đạt được sự phù hợp đủ tốt. Nó đòi hỏi bạn phải hiểu rõ về mô hình mà chúng ta đang thử. Đối với mô hình ARIMA, hiệu chuẩn thủ công được thực hiện với sự trợ giúp của biểu đồ tương quan tự động cho thông số 'p', biểu đồ tương quan tự động một phần cho thông số 'q' và kiểm tra ADF để xác nhận tính ổn định của chuỗi thời gian và cài đặt thông số 'd' . Chúng ta sẽ thảo luận chi tiết về tất cả những điều này trong các chương tới.
Tìm kiếm lưới
Một cách khác để hiệu chỉnh mô hình là tìm kiếm theo lưới, về cơ bản có nghĩa là bạn thử xây dựng một mô hình cho tất cả các kết hợp có thể có của các tham số và chọn một mô hình có sai số tối thiểu. Điều này tốn thời gian và do đó rất hữu ích khi số lượng tham số được hiệu chỉnh và phạm vi giá trị mà chúng lấy ít hơn vì điều này liên quan đến nhiều vòng lặp for lồng nhau.
Thuật toán di truyền
Thuật toán di truyền hoạt động trên nguyên tắc sinh học rằng một giải pháp tốt cuối cùng sẽ phát triển thành giải pháp 'tối ưu' nhất. Nó sử dụng các hoạt động sinh học về đột biến, lai chéo và chọn lọc để cuối cùng đạt được giải pháp tối ưu.
Để biết thêm kiến thức, bạn có thể đọc về các kỹ thuật tối ưu hóa tham số khác như tối ưu hóa Bayesian và tối ưu hóa Swarm.