การใช้โมเดลภาษาขนาดใหญ่

May 02 2023

การแนะนำ

OpenAI ChatGPT ทำให้โลกต้องตกตะลึง อัตราการนำไปใช้ที่ไม่เคยมีมาก่อนของผู้ใช้ได้รับการจับคู่โดยการทดลองที่ไม่เคยมีมาก่อนกับ API โดยชุมชนนักพัฒนา

OpenAI ChatGPT ทำให้โลกต้องตกตะลึง อัตราการนำไปใช้ที่ไม่เคยมีมาก่อนของผู้ใช้ได้รับการจับคู่โดยการทดลองที่ไม่เคยมีมาก่อนกับ API โดยชุมชนนักพัฒนา ไม่ใช่วันเดียวผ่านไปเมื่อ PoC หนึ่งหรือสองครั้งไม่ได้เผยแพร่บนบล็อกหรือทวีต สิ่งเหล่านี้ได้รับการปรับปรุงโดยนักพัฒนาชุดอื่นที่เติมพลังให้กับความคลั่งไคล้ในเทคโนโลยี

การพัฒนาโมเดลภาษาขนาดใหญ่ (LLMs) ใหม่ได้เร่งตัวขึ้นมากเช่นกัน รุ่นใหม่กำลังประกาศโดย บริษัท หรือทำโอเพ่นซอร์ส มีโครงการโอเพ่นซอร์สจำนวนมากที่พร้อมใช้งานหรือเปิดตัวเพื่อแก้ปัญหาในแง่มุมต่างๆ ของคำชี้แจงปัญหา ตั้งแต่การฝึกอบรมโมเดลที่กำหนดเองไปจนถึงการปรับแต่งอย่างละเอียด คลังข้อมูล ฯลฯ

ในขณะเดียวกัน ชุมชนนักพัฒนาก็ทำงานอย่างรวดเร็วเพื่อเผยแพร่เฟรมเวิร์กซึ่งจะทำให้การดำเนินงานกับ LLM ง่ายขึ้น เฟรมเวิร์กเช่นLangChainและLlama Indexมอบโค้ดสำเร็จรูปและเฟรมเวิร์กที่แก้ไขกรณีทั่วไปและเฉพาะเจาะจงจำนวนมาก นอกจากนี้ เราสามารถใช้มันเพื่อสร้างกรณีการใช้งานที่ซับซ้อนของตนเองได้

ดังนั้นเราจึงเห็นว่าภูมิทัศน์ทั้งหมดกำลังพัฒนาไปอย่างรวดเร็วมาก อันที่จริงแล้ว เฟรมเวิร์กเช่น LangChain ปล่อยรุ่นย่อยทุกๆ สองสามวัน

การประยุกต์ใช้ OpenAI

ข้อมูลการฝึกอบรมขนาดใหญ่ของ OpenAI LLM ทำให้พวกเขาสามารถเข้าถึงคลังความรู้ขนาดใหญ่ได้ สิ่งนี้ทำให้เหมาะอย่างยิ่งสำหรับการทำงานเกี่ยวกับกรณีการใช้งานตามเนื้อหา

กรณีการใช้งานบางกรณีที่มีการใช้งานแล้ว ได้แก่ :

สรุป
การเพิ่มคุณค่าเนื้อหา
การสร้างชื่อเรื่อง
ถ้อยคำใหม่
การสร้างหลายรูปแบบ เช่น แบบสั้น ทวีต จุดนำเสนอ เป็นต้น

ในกรณีข้างต้น ความสามารถด้านภาษาของ LLM ถูกนำมาใช้เพื่อแก้ไขหรือช่วยเหลืองานที่เกี่ยวข้องกับเนื้อหา

กรณีการใช้งานอื่น ๆ ที่ใช้ความรู้โดยธรรมชาติของ LLM คือ:

การสร้างเนื้อหาแบบทดสอบ
แบบสำรวจความคิดเห็นหรือแบบสำรวจ

การส่งผ่านบริบทอินพุตและการตอบคำถามในเรื่องเดียวกันนั้นเป็นงานที่ LLM ค่อนข้างเชี่ยวชาญ ความสามารถนี้ถูกใช้สำหรับเนื้อหาจำนวนมาก เช่น การรับคำตอบในบทความแบบยาวหรือเอกสาร PDF

โซลูชันโดยรวมเกี่ยวข้องกับการสร้างพรอมต์ในรูปแบบทั่วไปต่อไปนี้:

บริบท:

หุบเขา Ziro ในรัฐอรุณาจัลประเทศเป็นที่อยู่อาศัยของชนเผ่า Apatani และเป็นที่รู้จักจากทิวทัศน์หุบเขาที่สวยงามราวกับภาพวาด Ziro อยู่ห่างจากเมืองหลวง Itanagar ประมาณ 167 กม. และการขับรถไปยังเมืองนี้เป็นหนึ่งในเส้นทางขับรถที่สวยงามที่สุดที่คุณจะได้สัมผัสในอรุณาจัลประเทศ หุบเขาล้อมรอบด้วยป่าเขียวขจีและฟาร์มขั้นบันไดที่ดูสวยงามตลอดเวลาของปี เมื่อมองดูลำธารที่ไหลเอื่อยไหลเอื่อยข้างถนน คุณจะรู้สึกถึงความสงบในซีโร ไม่น่าแปลกใจเลยที่หุบเขานี้เป็นหนึ่งในสถานที่ที่มีผู้เข้าชมมากที่สุดในอรุณาจัลประเทศ

ทิวทัศน์อันงดงามของหุบเขา Ziro เป็นหนึ่งในเหตุผลหลักว่าทำไมเทศกาลดนตรี Ziro ประจำปีจึงถูกจัดขึ้นที่นี่ ท่ามกลางทุ่งหญ้าเขียวขจี สถานที่จัดงานเทศกาลนี้เป็นหนึ่งในสถานที่ที่สวยงามที่สุดในอินเดีย ผู้รักเสียงเพลงจากทั่วอินเดียและทั่วโลกมาที่นี่เพื่อร่วมงานเทศกาลและสัมผัสบรรยากาศอันยิ่งใหญ่

คำแนะนำพร้อมท์: ตอบคำถามด้านล่างใน 100 คำจากบริบทที่ให้ไว้ด้านบน

คำถาม: Ziro อยู่ห่างจากเมืองหลวงแค่ไหน?

คำตอบ:

LLM ให้คำตอบสำหรับคำถามจากบริบทที่ให้ไว้ เราต้องเล่นซอรอบ ๆ ด้วยการตั้งค่าที่รวดเร็วเพื่อให้ได้ผลลัพธ์ที่ต้องการ

วิธีการโดยรวมนี้เปิดโลกสำหรับการตอบคำถามของผู้ใช้ตามคลังเนื้อหา ตัวอย่างเช่น คลังข้อมูลที่สร้างขึ้นจากข่าวและบทความเกี่ยวกับงบประมาณสามารถใช้เพื่อตอบคำถามที่ผู้อ่านอาจมี การลัดวงจรนี้ทำให้รูปแบบดั้งเดิมของผู้ใช้ป้อนสตริงการค้นหา จากนั้นจึงแสดงลิงก์บทความจำนวนมาก ซึ่งผู้ใช้จำเป็นต้องอ่านอย่างละเอียดเพื่อให้ได้คำตอบที่ต้องการ สิ่งนี้มอบประสบการณ์การใช้งานที่ดีขึ้นมากและช่วยประหยัดเวลาได้มาก

วิธีการหมุนรอบการให้บริบทที่ถูกต้องแก่ LLM เพื่อให้สามารถตอบคำถามได้ ดังนั้น ปัญหาในตอนนี้คือวิธีระบุชุดข้อมูลโค้ดที่ถูกต้องจากคลังข้อมูลที่เกี่ยวข้องกับข้อความค้นหา เนื่องจากแอป LLM มีข้อจำกัดเกี่ยวกับจำนวนอินพุตที่สามารถส่งได้

นี่เป็นปัญหาหลักในการค้นหาในขณะนี้ เนื้อหาสามารถแบ่งออกเป็นส่วนย่อยและจัดทำดัชนี สามารถใช้ฐานข้อมูลเวกเตอร์เช่น Pinecone หรือ Milvus ได้ เนื้อหาถูกทำให้เป็นเวกเตอร์และจัดเก็บไว้ในฐานข้อมูล เมื่อผู้ใช้ถามคำถาม เพียงแค่ทำให้ข้อความค้นหาเป็นเวกเตอร์และค้นหาความคล้ายคลึงกันเพื่อรับตัวอย่างข้อมูลที่เกี่ยวข้อง

การค้นหาข้อความฟรีที่ชาญฉลาดยิ่งขึ้น

การค้นหาข้อความอิสระนั้นง่ายกว่าจากมุมมองของ UX เมื่อเทียบกับการค้นหาตามตัวกรองแบบดั้งเดิม อย่างไรก็ตาม มันเกี่ยวข้องกับการพัฒนาตรรกะการแยกวิเคราะห์ที่ซับซ้อนเพื่อระบุตัวกรองการค้นหาจากข้อความที่ป้อนโดยผู้ใช้ ดังนั้นจึงมีแนวโน้มที่จะเกิดข้อบกพร่องหรือรูปแบบการป้อนข้อความตายตัวชุดเล็กๆ

สามารถใช้ความสามารถด้านภาษาของ LLM ที่นี่เพื่อแยกวิเคราะห์ข้อความค้นหาและระบุพารามิเตอร์การค้นหา

โซลูชันโดยรวมเกี่ยวข้องกับการสร้างพรอมต์ในรูปแบบทั่วไปต่อไปนี้:

คำแนะนำพร้อมท์: แยกวิเคราะห์คิวรีอินพุตที่ให้ไว้ในรูปแบบ JSON ต่อไปนี้”

รูปแบบ JSON:

{“สถานที่”: “สถานที่ที่หนึ่งกำลังเยี่ยมชม บังคับ” , “checkInDate”: ”วันที่เช็คอินสำหรับการจอง บังคับ. รูปแบบ dd/mm/yyyy", "checkOutDate" : " วันที่เช็คเอาท์สำหรับการจอง บังคับ. เช็คอินเริ่มต้นบวก 2 วัน รูปแบบ dd/mm/yyyy”, “minimumRating”: “การให้คะแนนขั้นต่ำที่จำเป็นสำหรับโรงแรม ไม่บังคับ", "ราคาสูงสุดต่อคืน": "ราคาสูงสุดต่อคืนที่ยินดีจ่าย ไม่จำเป็น" }

ตัวอย่าง:

คำถาม: กำลังมองหาห้องพักตั้งแต่วันที่ 23 กรกฎาคมถึง 28 กรกฎาคมในชิมลาที่มีคะแนนตั้งแต่ 4 ขึ้นไป

คำตอบ: {“สถานที่”: “ชิมลา” , “checkInDate”: ”23/07/2023” “checkOutDate” : “28/07/2023” “minimumRating”: “4”}

คำถาม: กำลังมองหาห้องพักตั้งแต่ 15 ส.ค. เป็นเวลา 3 วันในดาร์จีลิง

คำตอบ: {“สถานที่”: “ดาร์จีลิ่ง” , “checkInDate”: ”15/08/2023” “checkOutDate” : “17/08/2023”}

คำถาม: ไปเที่ยวพอนดิเชอรีเป็นเวลา 5 วันตั้งแต่วันที่ 3 กันยายน

คำตอบ:

ในกรณีนี้ เราใช้ความสามารถของ LLM ที่เรียกว่า Zero Shot Learning นอกเหนือจากคำแนะนำแล้ว เรายังให้ตัวอย่างตัวอย่างบางส่วนเพื่อแสดงผลลัพธ์ที่คาดหวังสำหรับชุดคำถาม LLM ได้แสดงให้เห็นถึงความสามารถที่ยอดเยี่ยมในการปรับพฤติกรรมโดยการเรียนรู้จากกลุ่มตัวอย่างขนาดเล็ก

LLM จะแยกวิเคราะห์ข้อความค้นหาของผู้ใช้และระบุ JSON ในรูปแบบคงที่ จากนั้นสามารถใช้สิ่งเดียวกันนี้เพื่อเพิ่มพลังให้กับฟังก์ชันการค้นหาจริงได้

ในกรณีนี้ LLM เป็นตัวแยกวิเคราะห์ข้อความอัจฉริยะโดยพื้นฐานแล้ว

สนับสนุนบอท

ลองใช้ตัวอย่างแอปพลิเคชันจองการเดินทางเพื่อสำรวจกรณีการใช้งานนี้

ผู้ใช้โต้ตอบกับบอตสนับสนุนเพื่อรับคำตอบสำหรับคำถามเกี่ยวกับวิธีใช้แอปพลิเคชัน หรือประโยชน์ทั่วไป ฯลฯ หรือพวกเขาต้องการได้รับคำตอบเกี่ยวกับธุรกรรมที่ทำบนแอปพลิเคชัน

คลังข้อมูลของแอปพลิเคชัน การใช้งานทั่วไป สามารถสร้างเนื้อหาที่เกี่ยวข้องกับแอปพลิเคชันเพื่อตอบคำถามได้ในตัวเดียวกัน

ในทำนองเดียวกัน ตัวแยกวิเคราะห์แบบสอบถามที่ใช้ LLM อัจฉริยะสามารถใช้เพื่อแยกวิเคราะห์ข้อความค้นหาของผู้ใช้เกี่ยวกับการจอง จากนั้นดึงข้อมูลบันทึกการจอง เนื่องจากแอปพลิเคชันอาจมีธุรกรรมของผู้ใช้หลายประเภท จึงสามารถปรับตัวแยกวิเคราะห์ LLM เพื่อให้ระบุประเภทธุรกรรมรวมถึงพารามิเตอร์สำหรับธุรกรรมนั้นๆ ได้

การรวมฟังก์ชันการทำงานทั้งสองเข้าด้วยกันบนฟรอนท์เอนด์บอทเดียวยังเกี่ยวข้องกับขั้นตอนที่เราต้องระบุว่าอะไรคือความตั้งใจของผู้ใช้ ไม่ว่าคำถามนั้นจะเกี่ยวกับวิธีการทำธุรกรรมหรือสถานะของธุรกรรมล่าสุด ในที่นี้ LLM สามารถใช้ระบุเจตนาของผู้ใช้ได้อย่างถูกต้อง

ดังนั้น การแก้ปัญหาโดยรวมจึงเกี่ยวข้องกับ:

การระบุเจตนา: Corpus Query หรือ Booking Query
กำลังประมวลผลข้อความค้นหาคลังข้อมูล
ค้นหาคลังข้อมูล
การระบุตัวอย่างที่เกี่ยวข้อง
เรียกใช้ LLM โดยส่งตัวอย่างข้อมูลที่เกี่ยวข้องและข้อความค้นหาของผู้ใช้
กำลังประมวลผลการจองคิว
เรียกใช้ LLM เพื่อระบุประเภทและพารามิเตอร์
แยกวิเคราะห์การตอบสนอง LLM JSON
เรียกใช้ฟังก์ชันที่เหมาะสม

รูปที่ 1: รองรับ Bot สำหรับแอปพลิเคชันการเดินทาง

LLM มาพร้อมกับความท้าทายในการทำงานด้วย

ตามเนื้อผ้า นักพัฒนาคุ้นเคยกับการทำงานในโลกที่กำหนดขึ้น การตอบสนองจากการเรียกใช้ฟังก์ชันถูกกำหนดขึ้นโดยธรรมชาติ แม้ว่าจะล้มเหลวและทำให้เกิดข้อผิดพลาดก็ตาม

อย่างไรก็ตาม LLM ทำงานในลักษณะที่น่าจะเป็น คำตอบของพวกเขาไม่จำเป็นต้องเป็นไปตามที่เราคาดการณ์เสมอไป ซึ่งหมายความว่าเมื่อพัฒนาแอปพลิเคชันโดยใช้แอปพลิเคชันอย่างสม่ำเสมอ นักพัฒนาจะต้องตระหนักถึงสิ่งนี้อยู่เสมอ และสร้างความยืดหยุ่นที่เหมาะสมเพื่อจัดการกับสิ่งที่ไม่คาดคิด

เวลาตอบสนองของ OpenAI API นั้นละเอียดอ่อนมาก มีระยะเวลาตั้งแต่ 2–12 วินาที มากขึ้นอยู่กับปริมาณของเนื้อหาที่เกี่ยวข้อง ตัวอย่างเช่น การส่งบริบทขนาดใหญ่และการคาดหวังการตอบกลับโดยละเอียดสำหรับแบบสอบถามจะเกี่ยวข้องกับการคำนวณจำนวนมากสำหรับ LLM ดังนั้นเวลาในการตอบสนองจะอยู่ในด้านที่สูงกว่า บางส่วนสามารถจัดการได้อย่างชาญฉลาดโดยเปลี่ยนไปใช้ API ของสตรีมมิ่ง แต่ก็ยังหมายความว่าคำตอบสุดท้ายจะเสร็จสมบูรณ์หลังจากเวลาค่อนข้างสูง เปรียบเทียบกับ SLA เวลาตอบสนองของ API แบบดั้งเดิม

คำแนะนำเป็นวิธีหลักในการแนะนำ LLM เกี่ยวกับสิ่งที่เราต้องการให้ทำ การได้รับคำแนะนำที่ถูกต้องจึงมีความสำคัญอย่างยิ่ง อย่างไรก็ตามมีช่วงการเรียนรู้ที่เกี่ยวข้องเหมือนกัน ยิ่งไปกว่านั้น การแจ้งการทำงานกับ LLM เวอร์ชันหนึ่งจะทำงานแตกต่างกันเล็กน้อยกับอีกเวอร์ชันหนึ่ง โดยต้องมีการปรับแต่งเพื่อทำเช่นเดียวกัน

LLM ในฐานะเทคโนโลยีได้เปิดโอกาสในการคิดค้นวิธีการใหม่ในการแก้ปัญหา เรายังคงเข้าใจศักยภาพที่แท้จริงของมัน แนวคิดใหม่ๆ ที่หลั่งไหลเข้ามาบนอินเทอร์เน็ตทุกวันเป็นเครื่องพิสูจน์ถึงความจริงที่ว่ายังมีช่วงเวลาที่น่าตื่นเต้นรออยู่ข้างหน้า