ความแตกต่างระหว่าง autocorrelation และ partial autocorrelation

Aug 17 2020

ฉันได้อ่านบทความเกี่ยวกับอนุกรมเวลาอัตโนมัติบางส่วนแล้วและฉันต้องยอมรับว่าฉันไม่เข้าใจความแตกต่างของความสัมพันธ์อัตโนมัติแบบปกติ มักจะมีการระบุว่า autocorrelation ระหว่าง$y_t$ และ $y_t-k$ คือการแก้ไขระหว่าง $y_t$ และ $y_t-k$ ด้วยอิทธิพลของตัวแปรระหว่าง $y_t$ และ $y_t-k$เอาออก? ฉันไม่เข้าใจสิ่งนี้. ถ้าเราคำนวณความสัมพันธ์ระหว่าง$y_t$ และ $y_t-k$อย่างไรก็ตามตัวแปรระหว่างนั้นจะไม่ถูกรวมเข้าด้วยกันเลยหากคุณใช้ค่าสัมประสิทธิ์สหสัมพันธ์ในการทำเช่นนั้น ค่าสัมประสิทธิ์สหสัมพันธ์พิจารณาสองตัวแปรเท่าที่ฉันรู้

นี่ทำให้ฉันสับสนจริงๆ ฉันหวังว่าคุณจะช่วยฉันได้ ฉันขอขอบคุณทุกความคิดเห็นและจะขอบคุณสำหรับความช่วยเหลือของคุณ

อัปเดต: ทุกคนสามารถลองอธิบายวิธีคำนวณความสัมพันธ์อัตโนมัติและความสัมพันธ์อัตโนมัติบางส่วนสำหรับอนุกรมเวลาได้ ฉันเข้าใจวิธีการทำเช่นนี้กับตัวอย่าง แต่ไม่ใช่กับอนุกรมเวลา (เพราะคุณต้องการตัวแปรสามตัวตามตัวอย่างที่นี่https://en.wikipedia.org/wiki/Partial_correlation). คุณรู้จักตัวอย่างที่ทำหรือไม่

คำตอบ

4 Dayne Oct 11 2020 at 20:14

ในขณะที่ลืมเกี่ยวกับการประทับเวลา พิจารณาสามตัวแปร:$X, Y, Z$.

เอาเป็นว่า $Z$มีอิทธิพลโดยตรงต่อตัวแปร$X$. คุณสามารถคิด$Z$ เป็นพารามิเตอร์ทางเศรษฐกิจบางอย่างในสหรัฐอเมริกาซึ่งมีอิทธิพลต่อพารามิเตอร์ทางเศรษฐกิจอื่น ๆ $X$ ของจีน

ตอนนี้มันอาจจะเป็นพารามิเตอร์ $Y$ (พารามิเตอร์บางตัวในอังกฤษ) ยังได้รับอิทธิพลโดยตรงจาก $Z$. แต่มีความสัมพันธ์ที่เป็นอิสระระหว่าง$X$ และ $Y$เช่นกัน. โดยความเป็นอิสระในที่นี้ฉันหมายความว่าความสัมพันธ์นี้เป็นอิสระจาก$Z$.

คุณจะเห็นว่าเมื่อไหร่ $Z$ การเปลี่ยนแปลง $X$ การเปลี่ยนแปลงเนื่องจากความสัมพันธ์โดยตรงระหว่าง $X$ และ $Z$และยังเป็นเพราะ $Z$ การเปลี่ยนแปลง $Y$ ซึ่งจะเปลี่ยนไป $X$. ดังนั้น$X$ การเปลี่ยนแปลงเนื่องจากเหตุผลสองประการ

ตอนนี้อ่านสิ่งนี้ด้วย $Z=y_{t-h}, \ \ Y=y_{t-h+\tau}$ และ $X=y_t$ (ที่ไหน $h>\tau$).

Autocorrelation ระหว่าง $X$ และ $Z$ จะคำนึงถึงการเปลี่ยนแปลงทั้งหมดใน $X$ ไม่ว่าจะมาจาก $Z$ โดยตรงหรือผ่าน $Y$.

Autocorrelation บางส่วนจะขจัดผลกระทบทางอ้อมของ $Z$ บน $X$ ผ่านมา $Y$.

มันทำอย่างไร? มีการอธิบายไว้ในคำตอบอื่น ๆ สำหรับคำถามของคุณ

2 Michael Aug 18 2020 at 10:30

ความแตกต่างระหว่าง (ตัวอย่าง) ACF และ PACF นั้นมองเห็นได้ง่ายจากมุมมองการถดถอยเชิงเส้น

เพื่อรับ ACF ตัวอย่าง $\hat{\gamma}_h$ ที่ล้าหลัง $h$คุณพอดีกับแบบจำลองการถดถอยเชิงเส้น $$ y_t = \alpha + \beta y_{t-h} + u_t $$ และผลลัพธ์ $\hat{\beta}$ คือ $\hat{\gamma}_h$. เนื่องจากความนิ่ง (อ่อนแอ) การประมาณการ$\hat{\beta}$ คือความสัมพันธ์ตัวอย่างระหว่าง $y_t$ และ $y_{t-h}$. (มีความแตกต่างเล็กน้อยระหว่างวิธีคำนวณช่วงเวลาตัวอย่างระหว่างอนุกรมเวลาและบริบทการถดถอยเชิงเส้น แต่จะมีความสำคัญเล็กน้อยเมื่อขนาดของกลุ่มตัวอย่างมีขนาดใหญ่)

เพื่อรับตัวอย่าง PACF $\hat{\rho}_h$ ที่ล้าหลัง $h$คุณพอดีกับแบบจำลองการถดถอยเชิงเส้น $$ y_t = \alpha + \, ? y_{t-1} + \cdots + \, ? y_{t-h + 1} + \beta y_{t-h} + u_t $$ และผลลัพธ์ $\hat{\beta}$ คือ $\hat{\rho}_h$. ดังนั้น$\hat{\rho}_h$ คือ "ความสัมพันธ์ระหว่าง $y_t$ และ $y_{t-h}$ หลังจากควบคุมองค์ประกอบระดับกลาง "

การสนทนาเดียวกันนี้ใช้คำต่อคำกับความแตกต่างระหว่าง ACF ของประชากรและ PACF เพียงแค่แทนที่การถดถอยของตัวอย่างด้วยการถดถอยของประชากร สำหรับกระบวนการ AR (p) ที่หยุดนิ่งคุณจะพบว่า PACF เป็นศูนย์สำหรับความล่าช้า$h > p$. เรื่องนี้ไม่น่าแปลกใจ กระบวนการนี้ระบุโดยการถดถอยเชิงเส้น$$ y_t = \phi_0 + \phi_1 y_{t-1} + \cdots \phi_p y_{t-p} + \epsilon_t $$
ถ้าคุณเพิ่ม regressor (พูด $y_{t-p-1}$) ทางด้านขวามือที่ไม่เกี่ยวข้องกับเงื่อนไขข้อผิดพลาด $\epsilon_t$ค่าสัมประสิทธิ์ผลลัพธ์ (PACF ที่ lag $p+1$ ในกรณีนี้) จะเป็นศูนย์