통계-선형 회귀
상관 관계 분석을 통해 변수 간의 관계 정도를 정한 후에는 관계의 본질을 파헤치는 것이 당연하다. 회귀 분석은 변수 간의 원인과 결과 관계를 결정하는 데 도움이됩니다. 그래픽 방법이나 대수적 방법을 사용하여 독립 변수의 값을 예측할 수 있으면 다른 변수 (종속 변수라고 함)의 값을 예측할 수 있습니다.
그래픽 방식
X 축에는 독립 변수, Y 축에는 종속 변수가있는 분산 형 다이어그램을 그리는 작업이 포함됩니다. 그 후 대부분의 분포를 통과하는 방식으로 선이 그려지며 나머지 점은 선의 양쪽에 거의 고르게 분포됩니다.
회귀선은 데이터의 일반적인 움직임을 요약하는 최적 선이라고합니다. 다른 변수의 평균값에 해당하는 한 변수의 최상의 평균값을 보여줍니다. 회귀선은 종속 변수의 예측 값과 관찰 된 값 간의 편차 제곱의 합을 최소화하는 직선이라는 기준을 기반으로합니다.
대수적 방법
대수적 방법은 X에서 Y와 Y에서 X의 두 가지 회귀 방정식을 개발합니다.
X에 대한 Y의 회귀 방정식
$ {Y = a + bX} $
어디-
$ {Y} $ = 종속 변수
$ {X} $ = 독립 변수
$ {a} $ = Y 절편을 보여주는 상수
$ {b} $ = 선의 기울기를 나타내는 상수
a와 b의 값은 다음 정규 방정식으로 구합니다.
$ {\ sum Y = Na + b \ sum X \\ [7pt] \ sum XY = a \ sum X + b \ sum X ^ 2} $
어디-
$ {N} $ = 관찰 횟수
Y에 대한 X의 회귀 방정식
$ {X = a + bY} $
어디-
$ {X} $ = 종속 변수
$ {Y} $ = 독립 변수
$ {a} $ = Y 절편을 보여주는 상수
$ {b} $ = 선의 기울기를 나타내는 상수
a와 b의 값은 다음 정규 방정식으로 구합니다.
$ {\ sum X = Na + b \ sum Y \\ [7pt] \ sum XY = a \ sum Y + b \ sum Y ^ 2} $
어디-
$ {N} $ = 관찰 횟수
예
Problem Statement:
한 연구원은 아버지와 아들의 체중 경향 사이에 상관 관계가 있음을 발견했습니다. 그는 이제 주어진 데이터에서 두 변수에 대한 회귀 방정식을 개발하는 데 관심이 있습니다.
아버지의 무게 (kg) | 69 | 63 | 66 | 64 | 67 | 64 | 70 | 66 | 68 | 67 | 65 | 71 |
---|---|---|---|---|---|---|---|---|---|---|---|---|
아들의 무게 (kg) | 70 | 65 | 68 | 65 | 69 | 66 | 68 | 65 | 71 | 67 | 64 | 72 |
나타나게 하다
X에 대한 Y의 회귀 방정식.
Y에 대한 회귀 방정식.
Solution:
$ {X} $ | $ {X ^ 2} $ | $ {Y} $ | $ {Y ^ 2} $ | $ {XY} $ |
---|---|---|---|---|
69 | 4761 | 70 | 4900 | 4830 |
63 | 3969 | 65 | 4225 | 4095 |
66 | 4356 | 68 | 4624 | 4488 |
64 | 4096 | 65 | 4225 | 4160 |
67 | 4489 | 69 | 4761 | 4623 |
64 | 4096 | 66 | 4356 | 4224 |
70 | 4900 | 68 | 4624 | 4760 |
66 | 4356 | 65 | 4225 | 4290 |
68 | 4624 | 71 | 5041 | 4828 |
67 | 4489 | 67 | 4489 | 4489 |
65 | 4225 | 64 | 4096 | 4160 |
71 | 5041 | 72 | 5184 | 5112 |
$ {\ sum X = 800} $ | $ {\ sum X ^ 2 = 53,402} $ | $ {\ sum Y = 810} $ | $ {\ sum Y ^ 2 = 54,750} $ | $ {\ sum XY = 54,059} $ |
X에 대한 Y의 회귀 방정식
Y = a + bX
여기서, a와 b는 정규 방정식으로 구합니다.
$ {\ Rightarrow} $ 810 = 12a + 800b ... (i)
$ {\ Rightarrow} $ 54049 = 800a + 53402 b ... (ii)
방정식 (i)에 800을 곱하고 방정식 (ii)에 12를 곱하면 다음과 같이됩니다.
96000 a + 640000 b = 648000 ... (iii)
96000 a + 640824 b = 648588 ... (iv)
(iii)에서 방정식 (iv) 빼기
-824b = -588
$ {\ Rightarrow} $ b = -.0713
eq에서 b의 값을 대체합니다. (나는)
810 = 12a + 800 (-0.713)
810 = 12a + 570.4
12a = 239.6
$ {\ Rightarrow} $ a = 19.96
따라서 X의 방정식 Y는 다음과 같이 쓸 수 있습니다.
Y에 대한 X의 회귀 방정식
X = a + bY
여기서, a와 b는 정규 방정식으로 구합니다.
$ {\ Rightarrow} $ 800 = 12a + 810a + 810b ... (V)
$ {\ Rightarrow} $ 54,049 = 810a + 54, 750 ... (vi)
eq (v)에 810을 곱하고 eq (vi)에 12를 곱하면
9720 a + 656100 b = 648000 ... (vii)
9720 a + 65700 b = 648588 ... (viii)
eq vii에서 eq viii 빼기
900b = -588
$ {\ Rightarrow} $ b = 0.653
방정식 (v)에서 b의 값을 대입
800 = 12a + 810 (0.653)
12a = 271.07
$ {\ Rightarrow} $ a = 22.58
따라서 X와 Y의 회귀 방정식은 다음과 같습니다.