เราสามารถคาดการณ์การจัดอันดับ ESG จากข้อมูลที่เปิดเผยต่อสาธารณะได้หรือไม่?
บริษัทที่หารือเกี่ยวกับหัวข้อ ESG ในระหว่างการเรียกรับเงินได้คะแนน ESG ที่ดีกว่าหรือไม่ เราใช้เทคนิค NLP ที่แตกต่างกันในการให้คำตอบ
ภัยคุกคามที่เพิ่มขึ้นจากการเปลี่ยนแปลงสภาพภูมิอากาศทำให้ตลาดการเงินมุ่งเป้าหมายไปที่การลงทุนที่ยั่งยืนมากขึ้น บริษัทไม่ได้รับการประเมินจากกำไรเพียงอย่างเดียวอีกต่อไป แต่จะคำนึงถึงผลกระทบต่อสิ่งแวดล้อมและสังคมด้วย Caesura นี้มาพร้อมกับคำถามว่าจะวัดรอยเท้านี้อย่างไร และทำให้บริษัทต่างๆ เปรียบเทียบกันได้ การจัดอันดับสิ่งแวดล้อม สังคม และธรรมาภิบาล (ESG) ได้สร้างชื่อเสียงให้ตัวเองเป็นเครื่องมือที่ใช้วัดรอยเท้านี้ สถาบันจัดอันดับก่อตั้งขึ้นเพื่อแก้ไขปัญหานี้และให้คำแนะนำที่ดีที่สุดแก่นักลงทุนสำหรับการลงทุนที่ยั่งยืน ระหว่างฝึกงานที่ ELCA เราสามารถรวบรวมแหล่งข้อมูลที่ไม่มีโครงสร้าง ดึงข้อมูล และค้นพบความเชื่อมโยงระหว่างข้อมูลนี้กับการจัดอันดับ ESG
หน่วยงานจัดอันดับรวบรวมและประเมินแหล่งข้อมูลที่หลากหลาย ทั้งการเลือกแหล่งข้อมูลและวิธีการสร้างการให้คะแนนนั้นแตกต่างกันไปในแต่ละหน่วยงาน ไม่น่าแปลกใจที่รายงานความสัมพันธ์ระหว่างหน่วยงานจัดอันดับ ESG ต่างๆ ยังคงอยู่ในระดับต่ำตามที่รายงานในเอกสาร (cf. [Berg et al.|2019] and [Gibson et al.|2019] ) ข้อมูลของเราสนับสนุนข้อมูลเชิงลึกนี้ตามที่คุณเห็นในเมทริกซ์ความสัมพันธ์ระหว่างหน่วยงาน 3 แห่งที่เผยแพร่ข้อมูลของตนต่อสาธารณชนทั่วไป

ความจริงที่ว่าวิธีการดังกล่าวได้รับการเปิดเผยเพียงบางส่วนโดยหน่วยงานจัดอันดับได้กระตุ้นให้เราวิเคราะห์การจัดอันดับ ESG โดยใช้ข้อมูลโอเพ่นซอร์ส เนื่องจากคะแนน ESG ครอบคลุมหัวข้อต่างๆ มากมาย จึงมีแหล่งข้อมูลข้อความที่เกี่ยวข้องมากมาย เช่น แหล่งข่าว การให้คะแนนของนายจ้าง หรือรายงานความยั่งยืน สำหรับการทดสอบนี้ เราได้ตัดสินใจวิเคราะห์การรับสาย
การเรียกรับรายได้มีการประชุมทุกไตรมาสโดยบริษัทจดทะเบียนและเป็นช่องทางสื่อสารระหว่างนักลงทุนและนักวิเคราะห์ พวกเขาพูดคุยประเด็นที่เกี่ยวข้องกับ ESG มากขึ้น เช่น วิธีจัดการกับโรคระบาด วิธีการจัดการกับการเลือกปฏิบัติในรูปแบบต่างๆ หรือความพยายามที่พวกเขาได้ดำเนินการเพื่อลดการปล่อยก๊าซเรือนกระจก (GHG)
ตอนนี้ เราจะให้คำตอบสั้น ๆ สำหรับคำถามหากเราสามารถสร้างการเชื่อมโยงระหว่างการเรียกรายได้ของบริษัทและการจัดอันดับ ESG
คำตอบสั้น ๆ

เราวิเคราะห์การเรียกรายได้โดยแยกจำนวนการกล่าวถึง ESG ที่แตกต่างกันในช่วงเวลาหนึ่งสำหรับบริษัทมากกว่า 3,000 แห่ง ด้วยเหตุนี้ เราจึงสอนตัวแยกประเภทที่ไม่มีผู้ดูแลให้ระบุข้อความที่เกี่ยวข้องกับ ESG โดยใช้ประโยชน์จากรายงานความยั่งยืน เรายังแบ่งย่อหน้าที่เกี่ยวข้องกับ ESG ออกเป็น 26 หมวดหมู่ ESG ที่สื่อความหมาย เราสร้างคุณสมบัติโดยการรวบรวมข้อมูลที่เรารวบรวมเกี่ยวกับการเรียกรายได้สำหรับแต่ละบริษัท คุณลักษณะเหล่านี้ได้รับการวิเคราะห์ด้วยความช่วยเหลือของแบบจำลองเชิงเส้น
ในการวิเคราะห์เบื้องต้น เราสร้างความสัมพันธ์ระหว่างจำนวนเฉลี่ยของบริษัทที่มีการกล่าวถึง ESG ในการเรียกรายได้และการให้คะแนน ESG ของบริษัท ในการทำเช่นนั้น เราปรับโมเดลเชิงเส้นให้เหมาะกับตัวแปรเชิงพรรณนาสามตัว: อุตสาหกรรมของบริษัท (มีทั้งหมด 42 อุตสาหกรรม) “mean_total_mentions” ของบริษัท และ “mean_controversy” “mean_total_mentions” นับจำนวนย่อหน้าที่บริษัทได้อภิปรายหัวข้อ ESG ในระหว่างการเรียกรายได้ ด้วย “mean_controversy” เราพยายามรวบรวมหัวข้อที่บริษัทต่างๆ พยายามหลีกเลี่ยง แต่ถูกหยิบยกขึ้นมาพูดในช่วงถามตอบของการโทรแจ้งรายได้
เราจะเห็นว่าค่าสัมประสิทธิ์ความลาดชันของอุตสาหกรรมมีผลในเชิงบวก “ผู้ผลิตน้ำมันและก๊าซ” หรือ “กลุ่มบริษัทอุตสาหกรรม” มีความเสี่ยงด้าน ESG สูงที่สุด ในขณะที่ “สิ่งทอและเครื่องนุ่งห่ม” และ “สื่อ” มีความเสี่ยงด้าน ESG ค่อนข้างน้อย
เช่นเดียวกับ “mean_controversy” หรือไม่ การโต้เถียงมากขึ้นนำไปสู่ความเสี่ยงที่เกี่ยวข้องที่สูงขึ้นหรือไม่? ปรากฎว่าความชันไม่แตกต่างอย่างมีนัยสำคัญทางสถิติกับ 0
ในทางกลับกัน “mean_total_mentions” มีความชันเป็นลบอย่างมีนัยสำคัญในตัวแปรผลลัพธ์ บริษัทที่พูดคุยหัวข้อ ESG มากขึ้นระหว่างการเรียกรับเงินจะมีคะแนน ESG ที่ดีกว่า

ในหัวข้อต่อไปนี้ คุณสามารถดำดิ่งลงไปในชุดข้อมูล สำรวจไปป์ไลน์การเรียนรู้ของเครื่องสำหรับการแยกคุณลักษณะ และดูแบบจำลองเชิงเส้นที่เราใช้เพื่อตรวจสอบความสัมพันธ์ระหว่างคุณลักษณะที่สร้างขึ้นและการให้คะแนน
การจัดอันดับ ESG
การจัดอันดับ ESG มอบให้กับนักลงทุนโดยหน่วยงานจัดอันดับ ESG หลายแห่ง ซึ่งพัฒนาวิธีการของตนเพื่อประเมินประสิทธิภาพ ESG ของบริษัทต่างๆ ตามชื่อที่แนะนำ ประสิทธิภาพ ESG ของบริษัทได้รับการประเมินโดยการระบุและให้น้ำหนักตัวชี้วัดในสามด้านต่อไปนี้: ผลกระทบต่อสิ่งแวดล้อม ผลกระทบทางสังคม และคุณภาพของการกำกับดูแล มีสามแหล่งที่มาของความแตกต่างในการประเมินการจัดอันดับ ESG:
- ขอบเขต:ทั้งสามหมวดหมู่แบ่งออกเป็นหมวดหมู่ย่อยหลายหมวดหมู่ที่เกี่ยวข้อง การเลือกหมวดหมู่ย่อยเหล่านี้ขึ้นอยู่กับอัตนัยและขึ้นอยู่กับภูมิหลังทางวัฒนธรรมและส่วนบุคคล นอกจากนี้ หน่วยงานจัดอันดับยังกำหนดชุดของ "ประเด็นสำคัญ" สำหรับอุตสาหกรรมต่างๆ
- ความแตกต่างของการวัดผล:ภายในหมวดหมู่ย่อยเหล่านี้ หน่วยงานจัดอันดับจะระบุตัวบ่งชี้ที่เหมาะสมที่สุดในการประเมินประสิทธิภาพของบริษัท การเลือกตัวบ่งชี้และวิธีการประเมินตัวบ่งชี้เหล่านี้ (เช่น การเลือกแหล่งข้อมูล) อาจแตกต่างกันไปตามหน่วยงานต่างๆ RepRiskไม่พิจารณาแหล่งข้อมูลที่รายงานด้วยตนเองเนื่องจากพวกเขาตัดสินว่าไม่น่าเชื่อถือและมีอคติ
- ความแตกต่างของน้ำหนัก:การวัดที่แตกต่างกันจำเป็นต้องรวมเข้าในหมวดหมู่ย่อยต่างๆ และรวมเป็นการจัดอันดับ ESG เดียวในที่สุด
ความแตกต่างระหว่างหน่วยงานจัดอันดับที่แตกต่างกันทำให้เกิดกรณีที่น่าสนใจ เราสามารถถามตัวเองว่าเอกสารใดที่จำเป็นสำหรับการคาดการณ์การจัดอันดับ ESG ของการจัดอันดับที่แตกต่างกัน
รับสาย
ในระหว่างการเรียกรายได้ ฝ่ายบริหารขององค์กรจะนำเสนอรายได้ประจำไตรมาสและหารือเกี่ยวกับปัจจัยที่มีอิทธิพลอย่างมากต่อธุรกิจของพวกเขา คำพูดที่เตรียมไว้ของเจ้าหน้าที่บริษัทจะตามด้วยช่วงถามตอบที่นักวิเคราะห์และนักลงทุนสามารถถามคำถามเกี่ยวกับกระบวนการตัดสินใจของบริษัทและผลลัพธ์ของพวกเขา เซสชันเหล่านี้อาจมีประโยชน์อย่างยิ่งในการค้นหาข้อบกพร่องในกลยุทธ์ ESG หากมีการถามคำถามที่สำคัญมาก
ในช่วงหลายปีที่ผ่านมา เนื่องจากประสิทธิภาพ ESG ของบริษัทมีความสำคัญมากขึ้นสำหรับธุรกิจ หัวข้อ ESG จึงได้รับการกล่าวถึงบ่อยขึ้นในระหว่างการเรียกรายได้
จากข้อมูลสาธารณะนี้ เราสามารถวิเคราะห์ได้ว่าผู้บริหารของบริษัทใดนำเสนอหัวข้อที่เกี่ยวข้องกับ ESG และหารือเกี่ยวกับเรื่องนี้ในระหว่างการเรียกรับเงิน นอกจากนี้ เรายังสามารถวิเคราะห์ประเภทของปัญหา ESG และหากเกิดขึ้นระหว่างการแสดงความคิดเห็นที่เตรียมไว้หรือช่วงถามตอบ
ดำดิ่งสู่ข้อมูล
ต่อไปนี้ เราจะแสดงแนวทางของเราในการดึงข้อมูลจากการเรียกรับและประมวลผลล่วงหน้าสำหรับงานการถดถอย เราแปลงข้อมูลที่ไม่มีโครงสร้างเป็นข้อมูลแบบตารางและตรวจสอบความเชื่อมโยงที่เป็นไปได้ระหว่างข้อมูลที่แยกออกมาและการจัดอันดับ ESG
วิธีดึงข้อมูลจากการโทรรายรับ
ชุดข้อมูลของเราประกอบด้วยบันทึกการโทรเพื่อรับรายได้ประมาณ 43,000 รายการจากบริษัทประมาณ 3,000 แห่งที่รวบรวมจากแหล่งข้อมูลที่เข้าถึงได้แบบเปิดเผย เราแบ่งข้อความออกเป็นส่วน "ข้อสังเกตที่เตรียมไว้" และ "คำถามและคำตอบ" และแยกออกเป็นย่อหน้า หลังจากขั้นตอนก่อนการประมวลผลเหล่านี้ เราได้แยกคุณสมบัติออกเป็นสามขั้นตอน:
1) กรองย่อหน้าที่เกี่ยวข้อง
เราจำเป็นต้องระบุย่อหน้าที่มีการอภิปรายที่เกี่ยวข้องเกี่ยวกับหัวข้อ ESG แต่เราจะกำหนดความเกี่ยวข้องของ ESG ได้ อย่างไรเมื่อพบหัวข้อที่เกี่ยวข้องกับ ESG 26 หมวดหมู่ตามที่กำหนดโดยSustainability Accounting Standards Board (SASB) หมวดหมู่ของ SASB ได้แก่ "การปล่อยก๊าซเรือนกระจก (GHG)" "สุขภาพและความปลอดภัยของพนักงาน" หรือ "การจัดการสภาพแวดล้อมทางกฎหมายและข้อบังคับ"
หัวข้อ ESG จำนวนมากไม่ง่ายที่จะระบุในกองข้อมูลข้อความ โดยเฉพาะอย่างยิ่งหากชุดข้อมูลของคุณประกอบด้วยประมาณ 4 Mio ย่อหน้า จำเป็นต้องมีความรู้ด้านโดเมนเพื่อแก้ปัญหานี้อย่างถูกต้อง แต่ถ้าคุณไม่มีสิทธิ์เข้าถึงผู้เชี่ยวชาญด้านโดเมนล่ะ
เราใช้ประโยชน์จากรายงานความยั่งยืนเพื่อระบุหัวข้อที่เกี่ยวข้องกับ ESG รายงานความยั่งยืนเป็นเอกสารที่บริษัทจัดทำขึ้นเพื่อหารือเกี่ยวกับประเด็น ESG ที่สำคัญและอธิบายว่าบริษัทจัดการกับประเด็นเหล่านี้อย่างไร รายงานความยั่งยืนช่วยให้เราสามารถเรียนรู้เกี่ยวกับหัวข้อ ESG ที่เกี่ยวข้องและภาษาของพวกเขา
เรากำหนดภารกิจในการระบุย่อหน้า ESG ที่เกี่ยวข้องว่าเป็นปัญหาการเรียนรู้ที่ไม่มีผู้ดูแล เราสุ่มตัวอย่างย่อหน้า ESG 1 ล้านย่อหน้า ซึ่งครึ่งหนึ่งมาจากการเรียกรายได้ และอีกครึ่งหนึ่งมาจากรายงานความยั่งยืน เราใช้ " all-mpnet-base-v20 " เป็นการฝังประโยคและลดพื้นที่ฝังจาก 768 เป็น 10 มิติโดยใช้ UMAP การลดขนาดเป็นสิ่งสำคัญเพื่อหลีกเลี่ยง "คำสาปของมิติ" สำหรับวิธีการจัดกลุ่มต่อไปนี้ จากนั้นเราจะใช้ “HDBscan” เพื่อระบุย่อหน้าที่คล้ายกัน
เราแนะนำให้ใช้ “ BERTopic ” เนื่องจากดำเนินการไปป์ไลน์ในแพ็คเกจที่ใช้งานง่าย นอกจากนี้ยังมีวิธี TF-IDF ตามคลาสเพื่อแยกคำหลักที่สำคัญที่สุดของคลัสเตอร์

ในการกำหนดป้ายกำกับที่เกี่ยวข้องกับ ESG หรือไม่เกี่ยวข้องกับ ESG ให้กับคลัสเตอร์ ~141 เราใช้ความจริงที่ว่าย่อหน้าการเรียกรายได้ถูกครอบงำด้วยภาษาที่ไม่ใช่ ESG และรายงานความยั่งยืนมีหัวข้อที่เกี่ยวข้องกับ ESG เป็นส่วนใหญ่ ดังนั้นเราจึงจัดประเภทคลัสเตอร์ที่ถูกควบคุมโดยย่อหน้าจากรายงานความยั่งยืนว่ามีความเกี่ยวข้อง และกลุ่มที่มีย่อหน้าการเรียกรายได้เป็นส่วนใหญ่ว่าไม่เกี่ยวข้อง จากนั้นเราจะจบลงด้วยย่อหน้าการเรียกรายได้ 500,000 รายการที่จำแนกเป็นหมวดหมู่ที่เกี่ยวข้องกับ ESG และไม่เกี่ยวข้องกับ ESG

หลังจากแก้ไขคลัสเตอร์ที่จำแนกประเภทผิดอย่างเห็นได้ชัดด้วยมือแล้ว เราถือชุดข้อมูลที่มีป้ายกำกับซึ่งมีสัญญาณรบกวนค่อนข้างน้อยซึ่งเกิดจากการระบุหัวข้อ ESG ที่เกี่ยวข้องในอุตสาหกรรมต่างๆ โดยอัตโนมัติ วิธีการจัดหมวดหมู่แบบไม่มีผู้ดูแลแสดงไว้ในภาพด้านบน วิธีการนี้ลัดวงจรกระบวนการที่เจ็บปวดในการระบุหัวข้อ ESG ที่เกี่ยวข้องที่แตกต่างกันสำหรับอุตสาหกรรมต่างๆ และติดฉลากย่อหน้าการเรียกรายได้ที่มีข้อมูลที่เกี่ยวข้องกับ ESG ค่อนข้างน้อย ต่อไปนี้ เราจะใช้ชุดข้อมูลนี้เพื่อฝึกโมเดลภายใต้การดูแล
สำหรับการประเมินแบบจำลองการจำแนกประเภทต่างๆ เราสร้างชุดข้อมูลมาตรฐานทองคำของย่อหน้าที่มีคำอธิบายประกอบด้วยมือ เราใช้วิธีการตามคำหลักง่ายๆ ตามผลงานของ Evan Tylenda และคนอื่นๆเป็นพื้นฐานในการเปรียบเทียบโมเดลที่เราดูแล
เราประเมินวิธีการจัดประเภทที่แตกต่างกันในการฝังข้อความสองประเภทที่แตกต่างกัน ในแง่หนึ่ง เราใช้การฝัง TF-IDF เพื่อฝึกแบบจำลองที่ระบุคำหลักที่ฉลาดที่สุดเพื่อจำแนกย่อหน้าอย่างถูกต้อง ในทางกลับกัน เรายังสำรวจการใช้ Bert-embeddings (ตามESGBert ) ที่ได้รับการฝึกอบรมเกี่ยวกับข้อมูล ESG
ESGBertที่ปรับแต่งอย่างละเอียดในงานการจัดประเภทกลายเป็นรูปแบบที่เราเลือกใช้ ซึ่งน่าจะเป็นเพราะได้รับการฝึกฝนล่วงหน้าในภาษา ESG แล้ว แบบจำลองหม้อแปลงนี้ช่วยแก้ปัญหาแรกของเรา: การระบุย่อหน้า ESG ที่เกี่ยวข้อง
2) การจำแนกหัวข้อ ESG
ย่อหน้าที่เกี่ยวข้องจัดอยู่ในหมวดหมู่ ESG หนึ่งใน 26 หมวดหมู่ เช่น "คุณภาพและความปลอดภัยของผลิตภัณฑ์" "การปล่อยก๊าซเรือนกระจก" "การจัดการพลังงาน" หรือ "การจัดการของเสียและวัสดุอันตราย" (นี่คือรายการหมวดหมู่ ESG ทั้งหมดตาม ถึง SASB) ESGBertได้รับการพัฒนาโดยเฉพาะสำหรับงานนี้ ดังนั้นเราจึงใช้แบบจำลองที่ได้รับการฝึกอบรมล่วงหน้านี้ซ้ำเพื่อจำแนกย่อหน้าที่เกี่ยวข้องกับ ESG ออกเป็น 26 หมวดหมู่ที่แตกต่างกัน
3) การรวมข้อมูล
ณ จุดนี้ เราได้แบ่งการเรียกรายรับของแต่ละบริษัทออกเป็นย่อหน้า เก็บเฉพาะรายการที่เกี่ยวข้อง และกำหนดให้เป็นหมวดหมู่ ESG เราจะแปลงข้อมูลนี้ให้เป็นรูปแบบที่ช่วยให้เราตรวจสอบความสัมพันธ์ระหว่างการเรียกรายได้ของบริษัทและการจัดอันดับ ESG ได้อย่างไร
เป้าหมายของเราคือการใช้ประโยชน์จากข้อเท็จจริงที่ว่าบันทึกการโทรเพื่อรับรายได้สามารถแยกออกเป็นส่วนความคิดเห็นที่เตรียมไว้และเซสชันถามตอบ ในขณะที่เจ้าหน้าที่ของบริษัทสามารถเตรียมพร้อมที่จะฉายแววในอดีตได้ แต่โดยทั่วไปแล้วพวกเขาจำเป็นต้องอดทนกับสิ่งหลังโดยไม่ได้เตรียมตัวมาก่อน เราพยายามใช้สถานการณ์นี้เพื่อประเมินว่าบริษัทพยายามหลีกเลี่ยงหัวข้อ ESG ที่ยากในส่วนที่เตรียมไว้หรือไม่ ซึ่งนำเสนอโดยนักวิเคราะห์หรือนักลงทุนในช่วงถามตอบ
ในคณิตศาสตร์บริสุทธิ์ วิธีการนี้สามารถกำหนดได้ดังนี้ อันดับแรก เราจะนับแต่ละหัวข้อ ESG สำหรับการเรียกรายได้แต่ละครั้งและแต่ละบริษัท:

จากนั้น เราจะแนะนำความแตกต่างระหว่างจำนวนของข้อสังเกตที่เตรียมไว้ และช่วงถามตอบ:

สุดท้าย เรากำหนดหัวข้อที่กล่าวถึงในเซสชันถามตอบ แต่ไม่ได้อยู่ในความคิดเห็นที่เตรียมไว้ว่าอาจเป็นข้อขัดแย้ง:

ในการรวมจำนวนเหล่านี้สำหรับแต่ละบริษัท เราจะหาค่าเฉลี่ยของการเรียกรายได้:

โดย K เป็นจำนวนรวมของการเรียกรายได้ต่อบริษัทที่เรารวบรวม
ตอนนี้เราจบลงด้วยตัวแปรจำนวนเฉลี่ย cᵖʳᵉᵖᵃʳᵉᵈ⁻ʳᵉᵐᵃʳᵏˢ, c {Q&A}, cᵒᵛᵉʳᵃˡˡ และ cᶜᵒⁿᵗʳᵒᵛᵉʳˢʸ cᵖʳᵉᵖᵃʳᵉᵈ⁻ʳᵉᵐᵃʳᵏˢ และ c{Q&A} มีความสัมพันธ์กันอย่างมาก ดังนั้นจึงไม่ควรใช้เป็นตัวแปรในการถดถอยเชิงเส้น ดังนั้นเราจึงใช้ cᵒᵛᵉʳᵃˡˡ และ cᶜᵒⁿᵗʳᵒᵛᵉʳˢʸ เป็นคุณสมบัติในการอธิบายแต่ละบริษัท
เราทดลองโดยใช้ค่าเฉลี่ยแบบไม่ถ่วงน้ำหนักอย่างง่ายและค่าเฉลี่ยถ่วงน้ำหนักที่ช่วยให้เราสามารถเน้นไปที่ ESG ที่กล่าวถึงในการเรียกรายได้ล่าสุดได้มากขึ้น เราไม่เพิ่มน้ำหนักลงในสูตรเนื่องจากจะทำให้การจัดทำดัชนีเกิดความสับสน
ณ จุดนี้ เรามี (un) จำนวนการกล่าวถึงโดยเฉลี่ยแบบถ่วงน้ำหนักสำหรับแต่ละหมวดหมู่ต่อบริษัทสำหรับความคิดเห็นที่เตรียมไว้และเซสชันถามตอบ
แนวโน้ม ESG เมื่อเวลาผ่านไป
เราวิเคราะห์คุณสมบัติที่แยกออกมาในช่วงเวลาหนึ่งเพื่อระบุข้อบกพร่องที่อาจเกิดขึ้นและค้นพบปัญหา ด้านล่างนี้ เราวางแผนส่วนแบ่งของการเรียกรับรายได้โดยมีการกล่าวถึงหัวข้อ ESG อย่างน้อยหนึ่งหัวข้อเมื่อเวลาผ่านไป เราจะเห็นว่าในช่วงหลายปีที่ผ่านมา หัวข้อ ESG จะถูกพูดถึงบ่อยขึ้นในระหว่างการโทรแจ้งรายได้ อย่างไรก็ตาม การเรียกรายได้จำนวนมากยังไม่มีการกล่าวถึง ESG เรายังระบุจุดสูงสุดในไตรมาสแรกของปี 2020

ในรูปด้านล่าง เราสามารถดูจำนวนเฉลี่ยของการกล่าวถึงต่อหมวดหมู่ ESG รูปนี้ช่วยให้เราสามารถอธิบายจุดสูงสุดที่เราสังเกตได้ก่อนหน้านี้ ด้วยโรคระบาดที่เริ่มขึ้นเมื่อปลายปี 2019 หลายบริษัทต้องจัดการกับปัญหาด้านสุขภาพและความปลอดภัยของพนักงาน เราจะเห็นจุดสูงสุดที่แข็งแกร่งในหมวดหมู่นั้นในไตรมาสแรกของปี 2020 ประเด็น ESG อื่นๆ เช่น “การมีส่วนร่วมของพนักงาน การรวมเข้าด้วยกัน และความหลากหลาย” ก็เพิ่มขึ้นอย่างมากเช่นกัน ด้วยการเคลื่อนไหว “ชีวิตคนผิวดำมีความสำคัญ” และ “LGBTQ+” หลังจากการสังหารจอร์จ ฟลอยด์ในเดือนพฤษภาคม 2020 นโยบายเหล่านี้จึงมีความสำคัญมากขึ้นสำหรับหลายบริษัท

การกล่าวถึง ESG ที่สัมพันธ์กันกับการให้คะแนน ESG
หลังจากแยกและตรวจสอบคุณลักษณะล่วงหน้าแล้ว เราจะทำการทดลองบางอย่างเพื่อดูว่าเราสามารถสร้างความสัมพันธ์ระหว่างคุณลักษณะที่แยกออกมาและการให้คะแนนได้หรือไม่ เรารวมคุณสมบัติการเรียกรายได้เข้ากับการให้คะแนนและจบลงด้วยจุดข้อมูล 3222 จุด การจัดอันดับวัดความเสี่ยงด้าน ESG ของบริษัท และค่าที่สูงขึ้นจะสอดคล้องกับประสิทธิภาพด้าน ESG ที่แย่ลง
เราทำการทดสอบสมมติฐานของความชันของการถดถอยเพื่อประเมินความสัมพันธ์เชิงเส้นที่เป็นไปได้ระหว่างคุณลักษณะที่ดึงออกมาและการให้คะแนน ESG เราทดสอบด้วยระดับนัยสำคัญที่ 5% การให้คะแนนของเรามีการกระจายตามปกติโดยประมาณ
เพื่อให้การทดสอบง่ายขึ้น เราคำนวณจำนวนการกล่าวถึงทั้งหมดต่อบริษัท

เราใช้การถดถอยเชิงเส้นด้วย

โดยที่ tᵒᵛᵉʳᵃˡˡ คือจำนวนเฉลี่ยของการกล่าวถึง ESG ต่อการเรียกรายได้ tᶜᵒⁿᵗʳᵒᵛᵉʳˢʸ เป็นเมตริก
เราใช้ “กลุ่มอุตสาหกรรม” เป็นตัวแปรบ่งชี้ เนื่องจากค่าเฉลี่ยของการจัดอันดับแตกต่างกันอย่างมากในแต่ละอุตสาหกรรม เราบันทึกสเกลใหญ่เนื่องจากการกระจายดูเหมือนจะเป็นไปตามกฎหมายที่มีอำนาจ บริษัทส่วนใหญ่มีการกล่าวถึง ESG เพียงไม่กี่แห่ง และบางบริษัทมีการกล่าวถึง ESG ในปริมาณที่สูงมาก เราแทนที่การกล่าวถึงเป็นศูนย์ด้วย min(number_of_mentions) / 2

ค่า R-squared ของโมเดลเชิงเส้นบ่งชี้ว่าตัวแปรของเราสามารถอธิบายความแปรปรวนในการให้คะแนนได้ดี ความแปรปรวนส่วนใหญ่อธิบายได้จากตัวแปรตัวบ่งชี้อุตสาหกรรม การเพิ่มคุณลักษณะทั้งสองของเรา tᵒᵛᵉʳᵃˡˡ และ tᶜᵒⁿᵗʳᵒᵛᵉʳˢʸ ปรับปรุงคะแนน R-squared จาก 0.435 เป็น 0.461 คะแนน R-squared ที่ปรับแล้วซึ่งแก้ไขสำหรับองศาอิสระเพิ่มเติม ปรับปรุงจาก 0.428 เป็น 0.454
เรายังสนใจในความชันของการถดถอยและสังเกตสิ่งต่อไปนี้
- เราสามารถปฏิเสธสมมติฐาน 0 และค้นหาความสัมพันธ์เชิงเส้นเชิงลบระหว่างจำนวนการกล่าวถึง tᵒᵛᵉʳᵃˡˡ และความเสี่ยง ESG (หมายความว่าการกล่าวถึง ESG มากขึ้นนำไปสู่ความเสี่ยง ESG ที่น้อยลง) สัญชาตญาณของเราสนับสนุนความชันเชิงลบว่าการกล่าวถึง ESG มากขึ้นควรนำไปสู่ความเสี่ยงที่ลดลง (ประสิทธิภาพ ESG ที่ดีขึ้น)
- เราไม่สามารถปฏิเสธสมมติฐาน 0 สำหรับคะแนนเฉลี่ยความขัดแย้ง (tᶜᵒⁿᵗʳᵒᵛᵉʳˢʸ) ที่ระดับนัยสำคัญ 5% ดูเหมือนว่าการสร้างตัวแปรนี้ไม่ใช่ความคิดที่ดี
- ความชันของตัวแปรบ่งชี้ของกลุ่มอุตสาหกรรมล้วนมีนัยสำคัญอยู่ที่ระดับ 5%

บทสรุป
เราสามารถสร้างการเชื่อมโยงระหว่างจำนวนเฉลี่ยของการกล่าวถึง ESG ในการเรียกรายได้และการให้คะแนนของบริษัท เราหวังว่าจะได้ข้อมูลเพิ่มเติมจากการกล่าวถึง ESG ของหมวดหมู่ต่างๆ ความสัมพันธ์ที่แน่นแฟ้นระหว่างคุณลักษณะต่างๆ เหล่านี้กับกลุ่มตัวอย่างจำนวนจำกัดทำให้เป็นงานที่ท้าทาย
ในการทำงานต่อไป เราจะตรวจสอบความสัมพันธ์ระหว่างคุณสมบัติและการให้คะแนนในระดับที่ละเอียดยิ่งขึ้น การตรวจสอบเงื่อนไขการโต้ตอบที่เป็นไปได้ระหว่างกลุ่มอุตสาหกรรมและการกล่าวถึง ESG อาจเป็นประโยชน์เช่นกัน นอกจากนี้ เราจะพยายามปรับปรุงการคาดการณ์โดยใช้สัญญาณที่ได้มาจากแหล่งเอกสารอื่นๆ
ฉันขอขอบคุณหัวหน้างานของฉัน Simon Häfeli และ Luc Seiler สำหรับความคิดเห็นและการสนทนาอันมีค่าระหว่างการฝึกงาน และ Nicolas Hubacher และ Antoine Hue สำหรับการตรวจสอบบทความโดยละเอียด ขอบคุณมาก :)