คำพูดในฐานะผู้เฝ้าประตู: การวัดข้อกำหนดและความหมายเฉพาะของระเบียบวินัยในสิ่งพิมพ์ทางวิชาการ
![](https://post.nghiatu.com/assets/images/m/max/724/1*oMXO-yrMSrXL1tEJmTIIqA.png)
ข้อความทางวิชาการมักเต็มไปด้วยศัพท์แสงหรือภาษาพิเศษที่สามารถอำนวยความสะดวกในการสื่อสารอย่างมีประสิทธิภาพภายในสาขา แต่ขัดขวางความเข้าใจสำหรับบุคคลภายนอก ศัพท์แสงมีวิวัฒนาการตามธรรมชาติเพื่อให้นักวิจัยและนักวิชาการสามารถสื่อความหมายอย่างรวบรัด แต่อาจเป็นอุปสรรคระหว่างสาขา และระหว่างนักวิทยาศาสตร์กับสาธารณชนทั่วไป
ตัวอย่างเช่น คำต่างๆ เช่นสนธิไดโอดและไบอัสเป็นคำเฉพาะสำหรับฟิลด์ของออปโตอิเล็กทรอนิกส์ ดังแสดงในรูปด้านบน โดยเฉพาะอย่างยิ่งความลำเอียงนั้นเต็มไปด้วยความหมายหรือความรู้สึก ที่แตกต่าง กันไปในทุกแขนง เนื่องจากมันสามารถอ้างถึงการเลือกปฏิบัติทางสังคม การประมาณค่าทางสถิติที่ไม่ถูกต้อง หรือกระแสไฟฟ้า ในบทความของเราเราใช้วิธีการประมวลผลภาษาธรรมชาติ (NLP) ที่เรียกว่าการเหนี่ยวนำความรู้สึกของคำเพื่อแยกประสาทสัมผัสของคำ และแสดงให้เห็นว่าพวกเขาสามารถเชี่ยวชาญได้พอๆ กับประเภทคำเฉพาะฟิลด์ เรากำหนดศัพท์แสงเป็นทั้งคำเฉพาะวินัยและความหมายเฉพาะวินัย ดูผลการวิจัย ACL 2023 ของเราสำหรับคำอธิบายโดยละเอียดเกี่ยวกับวิธีที่เราดำเนินการและตรวจสอบการวัดศัพท์แสงของเรา
![](https://post.nghiatu.com/assets/images/m/max/724/1*Ytg0lzgyYOfo6nOf5VejKw.png)
เราวัดศัพท์แสงในบทคัดย่อภาษาอังกฤษในสาขาการศึกษาสามร้อยแห่งจากSemantic Scholar Open Research Corpus (S2ORC) เราพบว่าในขณะที่วิทยาศาสตร์ชีวภาพใช้ประเภทคำที่โดดเด่นมาก เช่น ชื่อของโมเลกุลและสารเคมี สาขาย่อยในคณิตศาสตร์ เทคโนโลยี ฟิสิกส์ และเศรษฐศาสตร์ มักจะนำคำที่มีอยู่แล้วมาใช้ใหม่โดยมีความหมายเฉพาะ ตัวอย่างเช่น นักคณิตศาสตร์นำคำทั่วไปมาใช้ใหม่ เช่นอำนาจ , ขั้ว , สหภาพ , พื้นผิวและต้นกำเนิด
เราเชื่อมโยงการวัดศัพท์แสงทางวิชาการเหล่านี้เข้ากับความหมายทางสังคมที่สำคัญสองประการ เพื่อแสดงประโยชน์ของเมตริกของเราสำหรับการวิจัย "ศาสตร์แห่งวิทยาศาสตร์" และภาษาศาสตร์สังคมเชิงคำนวณ ซึ่งเป็นการศึกษาว่าปัจจัยทางสังคมมีความสัมพันธ์กับภาษาอย่างไร
![](https://post.nghiatu.com/assets/images/m/max/724/1*MjpltbYyyYVd6VEL4UBUUQ.png)
ขั้นแรก เราวัดการออกแบบผู้ชมหรือว่านักวิชาการลดการใช้ศัพท์เฉพาะขึ้นอยู่กับว่าพวกเขาเขียนถึงใคร เราพบว่าฟิลด์ส่วนใหญ่ลดศัพท์แสงลงเมื่อเผยแพร่ในวารสารสหสาขาวิชาชีพทั่วไป เช่นNatureแต่บางฟิลด์ทำมากกว่าฟิลด์อื่น ตัวอย่างเช่น ในรูปด้านบน วิทยาการคอมพิวเตอร์ปรับเนื้อหาที่เผยแพร่ตามสถานที่มากกว่าการแพทย์และชีววิทยา คำอธิบายที่เป็นไปได้สำหรับพฤติกรรมนี้ก็คือ สถานที่จัดงานทั่วไปมีประวัติว่าถูกครอบงำโดยวิทยาศาสตร์ชีวภาพและกายภาพ¹ ดังนั้น แม้ว่าสถานที่ "วัตถุประสงค์ทั่วไป" อาจตั้งใจให้เป็นสถานที่สำหรับวิทยาศาสตร์ทั้งหมด² คาดว่าจะมีบางสาขา เพื่อปรับภาษาของพวกเขาให้มากกว่าคนอื่น
![](https://post.nghiatu.com/assets/images/m/max/724/1*vn-eo73AqHuXbvcG_jAvkg.png)
ประการที่สอง เราตรวจสอบว่าภาษาเฉพาะสาขาวิชามี ความเกี่ยวข้องกับการวัดความสำเร็จทางวิทยาศาสตร์สองแบบที่แตกต่างกันอย่างไร: จำนวนการอ้างอิงและผลกระทบแบบสหวิทยาการ ผลกระทบสหวิทยาการวัดความหลากหลายของสาขาที่อ้างอิงบทความ เราเรียกใช้โมเดลการถดถอยแยกกันสำหรับแต่ละฟิลด์ เพื่อดูว่าความสัมพันธ์ระหว่างศัพท์เฉพาะและความสำเร็จอาจแตกต่างกันอย่างไร แม้ว่าทิศทางของความสัมพันธ์ระหว่างศัพท์เฉพาะและอัตราการอ้างอิงจะแตกต่างกันไป แต่ศัพท์เฉพาะมักมีความสัมพันธ์เชิงลบกับผลกระทบของสหวิทยาการอยู่เสมอ³
เมื่อรวมกันแล้ว การค้นพบของเราชี้ให้เห็นว่าแม้ว่าบางสาขาจะไม่ลดการใช้ศัพท์เฉพาะลงมากเท่ากับสาขาอื่นๆ ในสถานที่ทั่วไป แต่การปฏิบัตินี้อาจเป็นอุปสรรคต่อการสื่อสารแบบสหวิทยาการ สิ่งนี้เปิดโอกาสที่เป็นไปได้สำหรับการพิจารณาบรรทัดฐานการเขียนนามธรรมใหม่ โดยเฉพาะอย่างยิ่งสำหรับสถานที่ที่ตั้งใจที่จะเชื่อมโยงระเบียบวินัย
[1] จดหมายก่อตั้งของPLOS One และการเปิดตัว รายงานทางวิทยาศาสตร์ครั้งแรกของ Nature เป็นสองตัวอย่างที่มาของสถานที่จัดงานทั่วไป
[2] ตัวอย่างเช่น ดู “ จุดมุ่งหมายและขอบเขต ” ของธรรมชาติ
[3] การศึกษาของเราไม่ใช่การศึกษาเชิงสาเหตุ แต่เป็นเส้นทางไปข้างหน้าสำหรับการศึกษาในอนาคตเกี่ยวกับผลกระทบของศัพท์แสงที่มีต่อความสัมพันธ์แบบสหวิทยาการ
ติดตาม@allen_aiและ@semanticscholarบน Twitter และสมัครรับจดหมายข่าว AI2เพื่อติดตามข่าวสารล่าสุดและการวิจัยที่ออกมาจาก AI2