회귀 모델의 다항식 (Bayesian 계층 모델)
나는 훈련 된 통계학자가 아니며 문헌에서 모델에 대한 설명을 얻고 자합니다. 문제의 연구는` 카운트 데이터의보고 부족을 수정하기위한 계층 적 프레임 워크입니다 . 방정식 11 ~ 14로 정의 된 모델 (아래 첨자 포함, 더 쉬운 해석을 위해 관련없는 용어 제거) :$$ \begin{align} z_{t} \mid y_{t} &\sim \operatorname{Binomial}\left(\pi, y_t \right) \\ \log \left(\frac{\pi}{1-\pi}\right)&=\beta_{0}+g\left(u\right) \\ y_{t} &\sim \operatorname{Poisson}\left(\lambda_{t}\right) \\ \log \left(\lambda_{t}\right) &=\log \left(P_{t, s}\right)+a_{0}+f_{1}\left(x_{s}^{(1)}\right)+f_{2}\left(x_{s}^{(2)}\right) \\ &+f_{3}\left(x_{s}^{(3)}\right)+f_{4}\left(x_{s}^{(4)}\right) \end{align} $$
어디 $z_t$ 관찰 된 카운트이고 $y_t$진짜, 진정한 카운트입니다. 그리고 기능$g, f_1, \ldots, f_4(\cdot)$ (종이에서)
3,2,2,2 차의 직교 다항식, 원시 다항식과 비교하여 단항식 (Kennedy 및 Gentle 1980) 간의 다중 공선 성을 줄이고 R에서 "poly"함수를 사용하여 설정되었습니다.
내 이해에서이 모델은 먼저 실제 개수를 추정합니다. $y_t$. 실제 개수 자체는 공변량이 모집단 인 로지스틱 회귀 공식 및 다음과 같은 사회적 지표에 따라 달라집니다.$x_s^{(1)} = $실업. 공변량은 직교 함수에 대한 입력으로 사용됩니다 . 실제 개수를 추정하면 이항 모델에서 해당 값을 사용하여 "성공"수, 즉 관찰 된 개수를 계산합니다. 이 경우 성공 확률은 공변량에 대한 직교 함수도있는 또 다른 회귀 공식에 의해 제공됩니다.
내 질문은 다소 간단합니다.
회귀 모델에서 직교 함수를 사용하는 것이 중요합니다. 단순 계수를 사용할 수없는 이유 (및 이러한 계수는 베이지안 구현에서 추정 됨).
의 해석
log
의$\pi$ 과 $\lambda$. 에 대한$\pi$, 회귀 공식은 (0, 1) 외부의 숫자로 평가할 수 있으므로 ilogit은 0, 1 사이에서 변환 할 것입니다. 왜 로그가 차지하는지 이해할 수 없습니다. $\lambda$.
답변
먼저 2.를 처리합시다.
짐작했듯이 로짓 변환 $\pi$회귀 공식이 값에 제한이 없도록 설계되었습니다. 모든 값이$(0,1)$. 로그 변환의 경우에도 마찬가지입니다.$\lambda$: $\lambda$ 양수 여야하며 로그 변환을 사용하면 회귀 공식이 양수 또는 음수 값을 취할 수 있습니다.
두 변환의 로그 부분은 또한 더하기보다는 곱셈 모델을 얻는다는 것을 의미하며, 이는 종종 개수와 비율에 더 적합합니다.
그리고 무엇보다도 이러한 특정 분포에 대한 이러한 변환이 약간 더 깔끔한 계산으로 이어지고 기본값이되는 수학적 이유가 있지만 그다지 중요한 이유는 아닙니다.
이제 직교 함수입니다. 이것들은 말하지 않습니다$f_1$ 직교하다 $f_2$; 결정하는 것은 데이터에 달려 있습니다. 그들은 말하고 있습니다$f_1$ 2 차 다항식 $x^{(1)}$, 가중 합이 아닌 직교 항의 가중 합으로 구현됩니다. $x$, $x^2$. 직교 다항식이 실제로 무엇인지는 데이터에 따라 다르지만 데이터가 균일 한 간격을두고 있다고 가정 해 보겠습니다.$[-1,1]$ 그리고 그들은 Chebyshev 다항식입니다. $T_0(x)=1,\, T_1(x)=x,\, T_2(x)=2x^2-1,\, T_3(x)=4x^3-3x$.
우리가 최대 가능성을 수행했다면 이것은 전혀 중요하지 않을 것입니다. 다음의 거듭 제곱을 기반으로 ML 추정치를 가정합니다.$x$ 였다 $-0.1+2.7x-3x^2+4.5x^3$. 우리는 이것을 직교 다항식으로 다시 쓸 수 있습니다.$T_3$ 4.5 / 4이어야합니다. $x^3$일치하고 나머지는 계산됩니다. 그것은 것으로 밝혀졌습니다$-1.6T_0+6.075T_1-1.5T_2+1.125T_3$. 이것들은 동일한 다항식 이고, 동일한 모델을 작성하는 다른 방법 일 뿐이며,이 경우 (그리고 거의 항상 현대 컴퓨터에서) 공선 성은 수치 반올림 문제를 일으킬만큼 충분히 강하지 않습니다.
하지만 베이지안 추론에는 사전 문제가 있습니다. 독립적 인 사전을 두는 것이 더 합리적입니다 ($\alpha_j$ 과 $\beta_k$ 논문에서)의 계수에 독립적 인 사전을 두는 것보다 직교 다항식의 계수에 대해 $x$, $x^2$, $x^3$. 그래서 내 가정은 직교 다항식이 상대적으로 평평하도록 선택되었다는 것입니다 ($N(0,10^2)$) 계수에 대한 독립적 인 사전이 합리적이었습니다.