ความแตกต่างระหว่าง autocorrelation และ partial autocorrelation
ฉันได้อ่านบทความเกี่ยวกับอนุกรมเวลาอัตโนมัติบางส่วนแล้วและฉันต้องยอมรับว่าฉันไม่เข้าใจความแตกต่างของความสัมพันธ์อัตโนมัติแบบปกติ มักจะมีการระบุว่า autocorrelation ระหว่าง$y_t$ และ $y_t-k$ คือการแก้ไขระหว่าง $y_t$ และ $y_t-k$ ด้วยอิทธิพลของตัวแปรระหว่าง $y_t$ และ $y_t-k$เอาออก? ฉันไม่เข้าใจสิ่งนี้. ถ้าเราคำนวณความสัมพันธ์ระหว่าง$y_t$ และ $y_t-k$อย่างไรก็ตามตัวแปรระหว่างนั้นจะไม่ถูกรวมเข้าด้วยกันเลยหากคุณใช้ค่าสัมประสิทธิ์สหสัมพันธ์ในการทำเช่นนั้น ค่าสัมประสิทธิ์สหสัมพันธ์พิจารณาสองตัวแปรเท่าที่ฉันรู้
นี่ทำให้ฉันสับสนจริงๆ ฉันหวังว่าคุณจะช่วยฉันได้ ฉันขอขอบคุณทุกความคิดเห็นและจะขอบคุณสำหรับความช่วยเหลือของคุณ
อัปเดต: ทุกคนสามารถลองอธิบายวิธีคำนวณความสัมพันธ์อัตโนมัติและความสัมพันธ์อัตโนมัติบางส่วนสำหรับอนุกรมเวลาได้ ฉันเข้าใจวิธีการทำเช่นนี้กับตัวอย่าง แต่ไม่ใช่กับอนุกรมเวลา (เพราะคุณต้องการตัวแปรสามตัวตามตัวอย่างที่นี่https://en.wikipedia.org/wiki/Partial_correlation). คุณรู้จักตัวอย่างที่ทำหรือไม่
คำตอบ
ในขณะที่ลืมเกี่ยวกับการประทับเวลา พิจารณาสามตัวแปร:$X, Y, Z$.
เอาเป็นว่า $Z$มีอิทธิพลโดยตรงต่อตัวแปร$X$. คุณสามารถคิด$Z$ เป็นพารามิเตอร์ทางเศรษฐกิจบางอย่างในสหรัฐอเมริกาซึ่งมีอิทธิพลต่อพารามิเตอร์ทางเศรษฐกิจอื่น ๆ $X$ ของจีน
ตอนนี้มันอาจจะเป็นพารามิเตอร์ $Y$ (พารามิเตอร์บางตัวในอังกฤษ) ยังได้รับอิทธิพลโดยตรงจาก $Z$. แต่มีความสัมพันธ์ที่เป็นอิสระระหว่าง$X$ และ $Y$เช่นกัน. โดยความเป็นอิสระในที่นี้ฉันหมายความว่าความสัมพันธ์นี้เป็นอิสระจาก$Z$.
คุณจะเห็นว่าเมื่อไหร่ $Z$ การเปลี่ยนแปลง $X$ การเปลี่ยนแปลงเนื่องจากความสัมพันธ์โดยตรงระหว่าง $X$ และ $Z$และยังเป็นเพราะ $Z$ การเปลี่ยนแปลง $Y$ ซึ่งจะเปลี่ยนไป $X$. ดังนั้น$X$ การเปลี่ยนแปลงเนื่องจากเหตุผลสองประการ
ตอนนี้อ่านสิ่งนี้ด้วย $Z=y_{t-h}, \ \ Y=y_{t-h+\tau}$ และ $X=y_t$ (ที่ไหน $h>\tau$).
Autocorrelation ระหว่าง $X$ และ $Z$ จะคำนึงถึงการเปลี่ยนแปลงทั้งหมดใน $X$ ไม่ว่าจะมาจาก $Z$ โดยตรงหรือผ่าน $Y$.
Autocorrelation บางส่วนจะขจัดผลกระทบทางอ้อมของ $Z$ บน $X$ ผ่านมา $Y$.
มันทำอย่างไร? มีการอธิบายไว้ในคำตอบอื่น ๆ สำหรับคำถามของคุณ
ความแตกต่างระหว่าง (ตัวอย่าง) ACF และ PACF นั้นมองเห็นได้ง่ายจากมุมมองการถดถอยเชิงเส้น
เพื่อรับ ACF ตัวอย่าง $\hat{\gamma}_h$ ที่ล้าหลัง $h$คุณพอดีกับแบบจำลองการถดถอยเชิงเส้น $$ y_t = \alpha + \beta y_{t-h} + u_t $$ และผลลัพธ์ $\hat{\beta}$ คือ $\hat{\gamma}_h$. เนื่องจากความนิ่ง (อ่อนแอ) การประมาณการ$\hat{\beta}$ คือความสัมพันธ์ตัวอย่างระหว่าง $y_t$ และ $y_{t-h}$. (มีความแตกต่างเล็กน้อยระหว่างวิธีคำนวณช่วงเวลาตัวอย่างระหว่างอนุกรมเวลาและบริบทการถดถอยเชิงเส้น แต่จะมีความสำคัญเล็กน้อยเมื่อขนาดของกลุ่มตัวอย่างมีขนาดใหญ่)
เพื่อรับตัวอย่าง PACF $\hat{\rho}_h$ ที่ล้าหลัง $h$คุณพอดีกับแบบจำลองการถดถอยเชิงเส้น $$ y_t = \alpha + \, ? y_{t-1} + \cdots + \, ? y_{t-h + 1} + \beta y_{t-h} + u_t $$ และผลลัพธ์ $\hat{\beta}$ คือ $\hat{\rho}_h$. ดังนั้น$\hat{\rho}_h$ คือ "ความสัมพันธ์ระหว่าง $y_t$ และ $y_{t-h}$ หลังจากควบคุมองค์ประกอบระดับกลาง "
การสนทนาเดียวกันนี้ใช้คำต่อคำกับความแตกต่างระหว่าง ACF ของประชากรและ PACF เพียงแค่แทนที่การถดถอยของตัวอย่างด้วยการถดถอยของประชากร สำหรับกระบวนการ AR (p) ที่หยุดนิ่งคุณจะพบว่า PACF เป็นศูนย์สำหรับความล่าช้า$h > p$. เรื่องนี้ไม่น่าแปลกใจ กระบวนการนี้ระบุโดยการถดถอยเชิงเส้น$$ y_t = \phi_0 + \phi_1 y_{t-1} + \cdots \phi_p y_{t-p} + \epsilon_t $$
ถ้าคุณเพิ่ม regressor (พูด $y_{t-p-1}$) ทางด้านขวามือที่ไม่เกี่ยวข้องกับเงื่อนไขข้อผิดพลาด $\epsilon_t$ค่าสัมประสิทธิ์ผลลัพธ์ (PACF ที่ lag $p+1$ ในกรณีนี้) จะเป็นศูนย์