시계열-매개 변수 교정
소개
모든 통계 또는 기계 학습 모델에는 데이터 모델링 방법에 큰 영향을 미치는 몇 가지 매개 변수가 있습니다. 예를 들어 ARIMA에는 p, d, q 값이 있습니다. 이러한 매개 변수는 실제 값과 모델링 된 값 사이의 오차가 최소가되도록 결정되어야합니다. 매개 변수 보정은 모델 피팅에서 가장 중요하고 시간이 많이 걸리는 작업이라고합니다. 따라서 최적의 매개 변수를 선택하는 것은 매우 중요합니다.
매개 변수 교정 방법
매개 변수를 보정하는 방법에는 여러 가지가 있습니다. 이 섹션에서는 이들 중 일부에 대해 자세히 설명합니다.
뺑소니
모델을 보정하는 일반적인 방법 중 하나는 시계열을 시각화하는 것으로 시작하고 일부 매개 변수 값을 직관적으로 시도하고 충분히 적합 할 때까지 반복해서 변경하는 수동 보정입니다. 우리가 시도하는 모델을 잘 이해해야합니다. ARIMA 모델의 경우 'p'매개 변수에 대한 자동 상관 플롯, 'q'매개 변수에 대한 부분 자기 상관 플롯 및 ADF 테스트를 통해 시계열의 정상 성을 확인하고 'd'매개 변수를 설정하여 손 보정을 수행합니다. . 이 모든 내용은 다음 장에서 자세히 설명합니다.
그리드 검색
모델을 보정하는 또 다른 방법은 그리드 검색을 사용하는 것입니다. 이는 기본적으로 가능한 모든 매개 변수 조합에 대한 모델을 구축하고 오류가 최소 인 모델을 선택하는 것을 의미합니다. 이것은 시간이 많이 걸리고 따라서 여러 개의 중첩 for 루프가 포함되므로 보정 할 매개 변수의 수가 적고 값의 범위가 적을 때 유용합니다.
유전 알고리즘
유전 알고리즘은 좋은 솔루션이 궁극적으로 가장 '최적'솔루션으로 진화한다는 생물학적 원리에 따라 작동합니다. 그것은 최종적으로 최적의 솔루션에 도달하기 위해 돌연변이, 교차 및 선택의 생물학적 작업을 사용합니다.
더 많은 지식을 얻으려면 Bayesian 최적화 및 Swarm 최적화와 같은 다른 매개 변수 최적화 기술에 대해 읽을 수 있습니다.