การอนุมานเชิงสาเหตุโดยใช้การควบคุมแบบสังเคราะห์
เป็นที่ยอมรับกันอย่างกว้างขวางว่าการทดสอบ A/B เป็นมาตรฐานทองคำสำหรับการอนุมานเชิงสาเหตุ เรียกอีกอย่างว่าการทดสอบแบบสุ่มที่มีกลุ่มควบคุม (RCTs) การทดสอบเหล่านี้เกี่ยวข้องกับการแบ่งอาสาสมัครออกเป็นหน่วยการรักษาและหน่วยควบคุม สิ่งนี้ทำให้มั่นใจได้ว่าความแตกต่างระหว่างหน่วยนั้นเกิดจากการรักษาที่ใช้ ธุรกิจต่างๆ ได้นำการทดสอบ A/B ไปใช้อย่างแพร่หลายเพื่อทดสอบผลิตภัณฑ์ คุณลักษณะ และกลยุทธ์ทางการตลาดใหม่ๆ สิ่งนี้ช่วยให้พวกเขาจับปฏิกิริยาของลูกค้า ปัญหาเกี่ยวกับผลิตภัณฑ์ ฯลฯ ได้ตั้งแต่ช่วงต้นของวงจรผลิตภัณฑ์หรือกลยุทธ์ อย่างไรก็ตาม มีหลายสถานการณ์ที่การแยกอาสาสมัครออกเป็นกลุ่มการรักษาและกลุ่มควบคุมแบบสุ่มอาจไม่ใช่ทางออกที่ดีที่สุด ตัวอย่างอาจเป็นการทดสอบโซเชียลมีเดีย ซึ่งผลกระทบของเครือข่ายอาจนำไปสู่การปนเปื้อนระหว่างการทดสอบและการควบคุม ในทำนองเดียวกัน ในบางกรณี อาจก่อให้เกิดข้อกังวลด้านจริยธรรม (ตัวอย่างเช่น ในการทดลองทางการแพทย์) หรืออาจมีราคาแพงเกินไปหรือแม้กระทั่งทำให้เป็นไปไม่ได้เนื่องจากข้อจำกัดทางเทคนิค ในสถานการณ์เหล่านี้เราใช้เทคนิคกึ่งทดลองเช่นความแตกต่างในการวิเคราะห์ผลต่าง (DID) การทดสอบคู่ที่ตรงกันการถดถอย เป็นต้น วิธีการควบคุมแบบสังเคราะห์ซึ่งเป็นจุดสำคัญของบทความนี้ เป็นหนึ่งในเทคนิคดังกล่าว บทความนี้สำรวจ:
1) รายละเอียดของวิธีการควบคุมสังเคราะห์
2) ข้อดีและข้อเสียและ
3) ข้อกำหนดข้อมูลสำหรับเทคนิค
วิธีการควบคุมสังเคราะห์ (SCM):
วิธีการควบคุมแบบสังเคราะห์คืออะไร?
เดิมทีวิธีการควบคุมแบบสังเคราะห์ถูกเสนอใน Abadie and Gardeazabal (2003) โดยมีจุดประสงค์เพื่อประเมินผลกระทบของการแทรกแซงโดยรวมต่อผลลัพธ์ที่น่าสนใจโดยรวม [1] ในที่นี้ การแทรกแซงโดยรวมคือการแทรกแซงที่ดำเนินการในระดับโดยรวมและส่งผลกระทบต่อหน่วยขนาดใหญ่จำนวนเล็กน้อย (เช่น เมือง ภูมิภาค หรือประเทศ) โดยมีพื้นฐานมาจากแนวคิดที่ว่าเมื่อมีการสังเกตการณ์ในระดับเอนทิตีโดยรวม การรวมหน่วยที่ไม่ได้รับผลกระทบอาจให้การเปรียบเทียบที่เหมาะสมกว่าหน่วยที่ไม่ได้รับผลกระทบเพียงหน่วยเดียว กล่าวง่ายๆ คือการเปรียบเทียบกลุ่มการรักษากับกลุ่มควบคุมที่รวมกันอย่างถ่วงน้ำหนัก SCM มีข้อได้เปรียบที่สำคัญสองประการเหนือเทคนิคกึ่งทดลองแบบดั้งเดิม:
1) สามารถอธิบายถึงผลกระทบของ confounders ที่เปลี่ยนแปลงไปตามกาลเวลา ในขณะที่สมมติฐานแนวโน้มคู่ขนานของ DID บอกเป็นนัยว่า หากปราศจากการแทรกแซง ผลลัพธ์สำหรับกลุ่มที่ได้รับการบำบัดและกลุ่มควบคุมจะเป็นไปตามแนวทางคู่ขนานเมื่อเวลาผ่านไป [1]
2) วิธีการนี้ทำให้การเลือกหน่วยเปรียบเทียบเป็นแบบแผนโดยใช้ขั้นตอนที่ขับเคลื่อนด้วยข้อมูล [2]
รายละเอียดรุ่น:
สมมติว่ามีหน่วย J โดยที่ j=1 เป็นการรักษา และ j=2, …, j=J เป็นหน่วยควบคุม ให้ Y เป็นตัวแปรผลลัพธ์ Y_(1t)^N เป็นค่าของตัวแปรผลลัพธ์ที่จะถูกสังเกตสำหรับหน่วยบำบัดในกรณีที่ไม่มีการแทรกแซง ณ เวลา t ให้ T_0 เป็นช่วงเวลาของการแทรกแซง Y_(1t) เป็นค่าของตัวแปรผลลัพธ์หลังการแทรกแซง และ Y_(jt) เป็นค่าของตัวแปรผลลัพธ์สำหรับหน่วยควบคุม j ที่เวลา t การใช้ w_j เป็นน้ำหนักที่เกี่ยวข้องกับชุดควบคุม ค่า Y_(1t)^N สามารถแสดงได้ดังนี้:
หากเป็นผลกระทบของการแทรกแซงการรักษาแล้วล่ะก็
ที่นี่ สามารถรับ Y_(1t) ได้จากการสังเกต Y หลังการแทรกแซง ในขณะที่ Y_(1t)^N ได้มาจากสมการ (1). คำถามยังคงอยู่: เราจะได้น้ำหนักสำหรับสมการข้างต้นได้อย่างไร Abadie, Diamond และ Hainmueller (2010) เสนอการคำนวณน้ำหนักในลักษณะที่คล้ายกับ
ในที่นี้ W คือเมทริกซ์ (J-1)x1 ของน้ำหนัก w_j, X_(t,pre) เป็นเวกเตอร์ของลักษณะก่อนการแทรกแซงสำหรับพื้นที่ที่เปิดเผย และ X_(c,pre) เป็นเวกเตอร์ของการแทรกแซงล่วงหน้าเดียวกัน ลักษณะเฉพาะสำหรับการควบคุม
ลักษณะเฉพาะก่อนการรักษา หรือที่รู้จักกันในชื่อความแปรปรวนร่วมสามารถเป็นตัวแปรใดๆ ที่แสดงถึงการรักษาได้อย่างเหมาะสม ตัวอย่างเช่น ใน Abadie, Diamond และ Hainmueller (2010) ในขณะที่ประมาณผลกระทบของข้อเสนอที่ 99 ต่อรัฐแคลิฟอร์เนีย ค่าตัวแปรร่วมที่ใช้คือราคาขายปลีกเฉลี่ยของบุหรี่ในช่วงก่อนการแทรกแซง ค่าเฉลี่ยต่อหัวของรัฐส่วนบุคคล รายได้ (บันทึก) ในช่วงก่อนการแทรกแซง เปอร์เซ็นต์ของประชากรอายุ 15–24 ปีในช่วงก่อนการแทรกแซง และค่าเฉลี่ยของการบริโภคเบียร์ต่อหัวในช่วงก่อนการแทรกแซง ตัวแปรเหล่านี้ได้รับการเสริมด้วยการบริโภคการสูบบุหรี่ที่ล้าหลังสามปี (ซึ่งเป็นตัวแปรผลลัพธ์ด้วย) อาจใช้ข้อมูลล่าช้ากี่ปีก็ได้เพื่อสร้างแบบจำลองหน่วยบำบัด [4]
สูตรในการคำนวณน้ำหนักสำหรับแบบจำลองแม้ว่าจะค่อนข้างคล้ายกับการถดถอยเชิงเส้น แต่ก็มีความแตกต่างเล็กน้อย โมเดลใช้ข้อจำกัดต่อไปนี้ซึ่งทำให้แตกต่างจากโมเดลการถดถอยเชิงเส้นแบบดั้งเดิม:
ข้อ จำกัด สองข้อสุดท้ายป้องกันวิธีการจากการอนุมาน เนื่องจากการควบคุมสังเคราะห์เป็นค่าเฉลี่ยถ่วงน้ำหนักของหน่วยควบคุมที่มีอยู่ วิธีนี้ทำให้ชัดเจน: (1) การมีส่วนร่วมสัมพัทธ์ของแต่ละหน่วยควบคุมกับข้อเท็จจริงที่น่าสนใจ; และ (2) ความคล้ายคลึงกัน (หรือไม่มี) ระหว่างหน่วยงานที่ได้รับผลกระทบจากเหตุการณ์หรือการแทรกแซงที่น่าสนใจและการควบคุมสังเคราะห์ ในแง่ของผลลัพธ์ก่อนการแทรกแซงและตัวทำนายอื่น ๆ ของผลลัพธ์หลังการแทรกแซง เมื่อเปรียบเทียบกับวิธีการถดถอยแบบดั้งเดิม ความโปร่งใสและการป้องกันการคาดการณ์เป็นคุณสมบัติที่น่าสนใจสองประการของวิธีการนี้ [4]
ตัวอย่างการใช้งาน:
สำหรับแบบฝึกหัดนี้ ฉันใช้ข้อมูลที่เปิดเผยต่อสาธารณะซึ่งมีรายละเอียดอธิบายไว้ใน [6] ตัวอย่างนี้ใช้รหัสจากบทความการทำความเข้าใจเกี่ยวกับวิธีการควบคุมสังเคราะห์
ในตัวอย่างนี้ เราจะพยายามประเมินผลกระทบของข้อเสนอที่ 99ต่อการบริโภคบุหรี่ต่อหัวต่อปีในระดับรัฐ ซึ่งวัดเป็นการขายบุหรี่ต่อหัวในชุดข้อมูลของเรา ดังนั้น สำหรับตัวอย่างนี้ ตัวแปรผลลัพธ์ที่เราสนใจคือ "การขายบุหรี่ต่อหัวต่อปี" ช่วงเวลาตัวอย่างสำหรับตัวอย่างของเราเริ่มต้นในปี 1970 และสิ้นสุดในปี 2000 รัฐแคลิฟอร์เนียแนะนำข้อเสนอที่ 99 ในปี 1989 ให้เราเริ่มต้นด้วยการดูข้อกำหนดเชิงบริบทของวิธีนี้ [1]:
- ผลกระทบเล็กน้อยที่มีความผันผวนสูงจะวัดด้วยวิธีนี้ได้ยาก
- ความพร้อมใช้งานของกลุ่มเปรียบเทียบ กล่าวคือ ไม่ใช่ทุกหน่วยที่รับการแทรกแซงที่คล้ายคลึงกับกลุ่มการรักษา สำหรับตัวอย่างนี้ รัฐที่ริเริ่มโครงการควบคุมยาสูบทั่วรัฐอย่างเป็นทางการหรือเพิ่มภาษีบุหรี่มากกว่า 50 เซ็นต์ในช่วงเวลาที่ทำการศึกษาของเรานั้นไม่ได้รับการยกเว้น
- ไม่มีผลกระทบต่อหน่วยควบคุม เช่น การใช้มาตรการแทรกแซงการรักษาไม่ส่งผลกระทบต่อตัวแปรผลลัพธ์ที่สนใจในหน่วยควบคุม ตัวอย่างนี้สันนิษฐานว่าไม่มีผลล้นระหว่างการบำบัดและหน่วยควบคุม
- ก่อนการแทรกแซง ความแตกต่างในลักษณะของการควบคุมสังเคราะห์และหน่วยที่ได้รับผลกระทบมีน้อย กล่าวคือ
ดังที่เราเห็นในภาพด้านบน ข้อมูลของเรามีสามคอลัมน์: รัฐ ปี และซิกเซล ซึ่งเป็นตัวแปรผลลัพธ์ที่น่าสนใจของเรา หรือที่รู้จักในชื่อ “การขายบุหรี่ต่อหัวต่อปี” เนื่องจากเราจะใช้ข้อมูลที่ล่าช้าเป็นตัวแปรร่วมสำหรับการออกกำลังกายของเรา เราจำเป็นต้องแปลงเป็นข้อมูลพาเนล กล่าวคือ แต่ละแถวจะแทนปีและแต่ละคอลัมน์จะแทนรัฐ
ต่อไปคือการเลือกสถานะการรักษา ซึ่งในกรณีของเราคือแคลิฟอร์เนียและปีการรักษาคือ 1989 ซึ่งเป็นปีแรกที่ข้อเสนอ 99 ได้รับการแนะนำในแคลิฟอร์เนีย ก่อนที่จะดำเนินการสร้างแคลิฟอร์เนียสังเคราะห์สำหรับการศึกษาของเรา ให้เราเปรียบเทียบการขายบุหรี่ในแคลิฟอร์เนียกับค่าเฉลี่ยของการขายบุหรี่ในรัฐควบคุมที่เหลือในการศึกษานี้
เมื่อพิจารณาจากตัวเลขข้างต้น ดูเหมือนว่ายอดขายบุหรี่ในแคลิฟอร์เนียหลังปี 1989 จะลดลงอย่างรวดเร็วกว่ารัฐควบคุมอื่นๆ ขั้นตอนต่อไปคือการสร้างแคลิฟอร์เนียสังเคราะห์ ก่อนอื่นเราจะกำหนดฟังก์ชันการถดถอยของเราด้วยข้อจำกัดด้านล่าง:
ฟังก์ชันทำนายแคลิฟอร์เนียสังเคราะห์:
ให้เราสร้างแคลิฟอร์เนียสังเคราะห์ของเราและดูน้ำหนักของสถานะการควบคุม:
ค่าสัมประสิทธิ์/น้ำหนักที่ได้จากแบบฝึกหัดนี้เกือบจะใกล้เคียงกับค่าที่กล่าวถึงใน [4] ความแปรปรวนเล็กน้อยเกิดจากความแตกต่างของความแปรปรวนร่วมที่ใช้ใน [4] และในตัวอย่างนี้ ถึงเวลาแล้วที่จะเปรียบเทียบแคลิฟอร์เนียสังเคราะห์กับแคลิฟอร์เนียที่สังเกตได้
เมื่อดูโครงเรื่องด้านบน ดูเหมือนว่าผลกระทบของข้อเสนอที่ 99 ต่อ cig ยอดขายเป็นลบ อย่างไรก็ตาม ลองนึกภาพความแตกต่างระหว่างแคลิฟอร์เนียที่สังเกตได้และแคลิฟอร์เนียสังเคราะห์:
แผนภาพความแตกต่างสามารถดึงความแตกต่างเชิงลบระหว่างแคลิฟอร์เนียสังเคราะห์และแคลิฟอร์เนียที่สังเกตได้ โดยเฉพาะอย่างยิ่งหลังจากปี 1988 ซึ่งเป็นปีการรักษาของเรา แม้ว่าตอนนี้เราสามารถสังเกตผลกระทบเชิงลบของข้อเสนอ 99 ต่อการขายบุหรี่ไฟฟ้าในแคลิฟอร์เนียได้ แต่คำถามสำคัญที่ยังคงอยู่คือเราจะทราบได้อย่างไรว่าผลกระทบนี้มีนัยสำคัญทางสถิติ สิ่งนี้นำเราไปสู่ส่วนสุดท้ายของบทความซึ่งเป็นการอนุมาน
การอนุมาน:
ตอนนี้เราได้สร้างแคลิฟอร์เนียสังเคราะห์และระบุความแตกต่างระหว่างแคลิฟอร์เนียสังเคราะห์และแคลิฟอร์เนียที่สังเกตได้ แล้วเราจะประเมินนัยสำคัญทางสถิติของการศึกษาของเราได้อย่างไร พูดง่ายๆ ก็คือ เราจะทราบได้อย่างไรว่าผลกระทบที่ตรวจพบในแคลิฟอร์เนียนั้นไม่ใช่เหตุการณ์ที่เกิดขึ้นโดยบังเอิญ เราจะใช้การทดสอบการเปลี่ยนแปลงที่อธิบายว่าเป็นการศึกษายาหลอกใน [4] เราจะใช้วิธีการควบคุมแบบสังเคราะห์กับรัฐที่ไม่ได้ดำเนินการตามข้อเสนอ 99 ในช่วงระยะเวลาของการศึกษาของเรา แนวคิดคือการใช้การควบคุมสังเคราะห์กับรัฐอื่น หากเราไม่สังเกตเห็นผลกระทบที่ใหญ่เท่ากับรัฐแคลิฟอร์เนีย ผลกระทบของข้อเสนอที่ 99 ต่อรัฐแคลิฟอร์เนียก็มีความสำคัญ
- การสร้างการควบคุมสังเคราะห์สำหรับสถานะทั้งหมดและวางแผนความแตกต่างระหว่างสถานะสังเคราะห์และสถานะที่สังเกตได้:
2. ลองลบสถานะด้วย MSE > 2*MSE ของสถานะการรักษา และดูความแตกต่างโดยประมาณระหว่างการควบคุมสังเคราะห์และสถานะ
หลังจากไม่รวมรัฐสุดโต่งแล้ว ดูเหมือนว่าผลกระทบของข้อเสนอ 99 ต่อแคลิฟอร์เนียนั้นเกิดขึ้นได้ยาก ใน [4] อัตราส่วนระหว่าง MSE Pre และ MSE Post ใช้สำหรับการทดสอบการเปลี่ยนแปลง
3. ให้เราคำนวณอัตราส่วนนั้นและประมาณค่า p สำหรับการทดสอบ:
ค่า p-value สำหรับการทดสอบของเราคือ 0.0256 เช่น ถ้ามีคนกำหนดสิ่งแทรกแซงโดยการสุ่มในข้อมูลนี้ ความน่าจะเป็นที่จะได้รับ MSE post/ MSE pre เท่ากับ California คือ ~0.026
อ้างอิง:
[1] อบาดี, อ. (2564). การใช้การควบคุมสังเคราะห์: ความเป็นไปได้ ความต้องการข้อมูล และแง่มุมของระเบียบวิธี วารสารวรรณคดีเศรษฐกิจ , 59 (2), 391–425.
[2] Abadie, A., Diamond, A. และ Hainmueller, J. (2015) การเมืองเปรียบเทียบและวิธีการควบคุมแบบสังเคราะห์ วารสารรัฐศาสตร์อเมริกัน , 59 (2), 495–510.
[3] Abadie, A., & Gardeazabal, J. (2546). ต้นทุนทางเศรษฐกิจของความขัดแย้ง: กรณีศึกษาของประเทศบาสก์ การทบทวนเศรษฐกิจอเมริกัน , 93 (1), 113–132.
[4] Abadie, A., Diamond, A., & Hainmueller, J. (2010). วิธีการควบคุมแบบสังเคราะห์สำหรับกรณีศึกษาเปรียบเทียบ: การประมาณผลกระทบของโครงการควบคุมยาสูบของรัฐแคลิฟอร์เนีย วารสารสมาคมสถิติแห่งอเมริกา , 105 (490), 493–505.
[5] Doudchenko, N. และ Imbens, GW (2016) การทรงตัว การถดถอย ความแตกต่างระหว่างความแตกต่าง และวิธีการควบคุมการสังเคราะห์: การสังเคราะห์ (ฉบับที่ w22791) สำนักวิจัยเศรษฐกิจแห่งชาติ.
[6] แหล่งข้อมูล — การบริโภคบุหรี่ต่อคน (เป็นซอง) ที่มา: Orzechowski และ Walker (2005) , ข้อมูลการเข้าถึงและการใช้ — สาธารณะ