วิธีการสร้างแบบจำลองระยะปฏิสัมพันธ์กับตัวถอยกำลังสอง?
ฉันเรียกใช้การถดถอยด้วยปฏิสัมพันธ์ของตัวถดถอยต่อเนื่องกำลังสองกับตัวถดถอยแบบแยกส่วน ใน Stata ตัวดำเนินการไขว้คู่##
จะสร้างชุดตัวถอยหลังทั้งหมดของฉัน นี่คือ MWE โดยพลการ:
* load data
use http://www.stata-press.com/data/r13/nlswork
* set panel structure
xtset idcode year
* fixed effects regression with interaction and square term
quietly xtreg ln_wage c.wks_ue##c.wks_ue##i.race union age i.year, i(idcode) fe
estimates store model1
* generate square term without interaction
gen wks_ue_sq = wks_ue^2
quietly xtreg ln_wage c.wks_ue##i.race wks_ue_sq union age i.year, i(idcode) fe
estimates store model2
estimates table model1 model2, keep(wks_ue c.wks_ue#c.wks_ue race#c.wks_ue race#c.wks_ue#c.wks_ue wks_ue_sq ) b p

ฉันควรทำในสิ่งที่เรียกว่า "การกลั่นกรองอย่างเต็มที่" หรือไม่? อย่างที่ฉันจะทำในการโต้ตอบสามเท่า มีเหตุผลทางทฤษฎีว่าทำไมฉันจึงมีสแควร์เทอมและสำหรับปฏิสัมพันธ์โดยทั่วไป แต่ฉันไม่สามารถให้ข้อโต้แย้งที่ดีเกี่ยวกับสิ่งที่จริง ๆ แล้วการโต้ตอบระยะสี่เหลี่ยมจะแสดงถึงในกรณีของฉัน
คำตอบ
สองคำตอบ ประการแรกการรวมปฏิสัมพันธ์กำลังสองนั้นมีเหตุผลเกือบตลอดเวลาในทางทฤษฎีโดยทฤษฎีบท Stone-Weierstrass ซึ่ง (อย่างหลวม ๆ ) ระบุว่าฟังก์ชันตอบสนองค่าเฉลี่ยที่แท้จริงของคุณนั้นดีกว่าและประมาณได้ดีกว่าโดยพหุนามลำดับที่สูงกว่าในของคุณ$X$ตัวแปร คำว่าปฏิสัมพันธ์กำลังสองเป็นคำที่มีพหุนามลำดับที่สูงกว่า แน่นอนในทางปฏิบัติเราต้องกังวลเกี่ยวกับการใส่อุปกรณ์มากเกินไปและเกี่ยวกับการใช้พหุนามประมาณเนื่องจากคุณสมบัติการประมาณค่าไม่ดี
อย่างไรก็ตามเหตุผลนี้ดูเหมือนจะไม่ค่อยดีนักในกรณีของคุณเพราะคุณต้องการเหตุผลของหัวข้อ คำตอบที่สองแม้ว่าจะโพสต์แบบ hocและดังนั้นจึงไม่เหมาะอย่างยิ่งคือการประมาณแบบจำลองสองแบบ: (i) แบบที่ง่ายกว่าโดยไม่มีการโต้ตอบกำลังสอง แต่กับสิ่งอื่นที่ถือว่าเกี่ยวข้องและ (ii) โมเดลเดียวกัน แต่รวมถึงการโต้ตอบกำลังสอง จากนั้นสร้างผังโปรไฟล์ของค่าเฉลี่ยโดยประมาณของ$Y$ เป็นหน้าที่ของคุณอย่างต่อเนื่อง $X$ สำหรับค่าคงที่ของหมวดหมู่ของคุณ $X$. วางซ้อนโปรไฟล์สำหรับ model (i) และ model (ii) โดยให้กราฟหนึ่งกราฟสำหรับแต่ละระดับของตัวแปรเชิงหมวดหมู่ของคุณ การเปรียบเทียบพล็อตเหล่านี้ร่วมกับการใช้ความรู้เรื่องของคุณจะช่วยให้คุณตัดสินใจได้ว่าคำโต้ตอบกำลังสองของคุณกำลังทำอะไรและมีความสำคัญหรือไม่
แก้ไข 21/8/2020 สิ่งหนึ่งที่สามารถคาดการณ์เบื้องต้นเมื่อ Squared ปฏิสัมพันธ์ทำนายต่อเนื่องกับตัวทำนายที่เด็ดขาดก็คือลักษณะของโค้งจะแตกต่างกันตามระดับเด็ดขาด ตัวอย่างเช่นอาจมีความโค้งเด่นชัดภายในบางระดับ แต่ไม่แสดงความโค้งอื่น ๆ