การใช้โมเดลภาษาขนาดใหญ่
OpenAI ChatGPT ทำให้โลกต้องตกตะลึง อัตราการนำไปใช้ที่ไม่เคยมีมาก่อนของผู้ใช้ได้รับการจับคู่โดยการทดลองที่ไม่เคยมีมาก่อนกับ API โดยชุมชนนักพัฒนา ไม่ใช่วันเดียวผ่านไปเมื่อ PoC หนึ่งหรือสองครั้งไม่ได้เผยแพร่บนบล็อกหรือทวีต สิ่งเหล่านี้ได้รับการปรับปรุงโดยนักพัฒนาชุดอื่นที่เติมพลังให้กับความคลั่งไคล้ในเทคโนโลยี
การพัฒนาโมเดลภาษาขนาดใหญ่ (LLMs) ใหม่ได้เร่งตัวขึ้นมากเช่นกัน รุ่นใหม่กำลังประกาศโดย บริษัท หรือทำโอเพ่นซอร์ส มีโครงการโอเพ่นซอร์สจำนวนมากที่พร้อมใช้งานหรือเปิดตัวเพื่อแก้ปัญหาในแง่มุมต่างๆ ของคำชี้แจงปัญหา ตั้งแต่การฝึกอบรมโมเดลที่กำหนดเองไปจนถึงการปรับแต่งอย่างละเอียด คลังข้อมูล ฯลฯ
ในขณะเดียวกัน ชุมชนนักพัฒนาก็ทำงานอย่างรวดเร็วเพื่อเผยแพร่เฟรมเวิร์กซึ่งจะทำให้การดำเนินงานกับ LLM ง่ายขึ้น เฟรมเวิร์กเช่นLangChainและLlama Indexมอบโค้ดสำเร็จรูปและเฟรมเวิร์กที่แก้ไขกรณีทั่วไปและเฉพาะเจาะจงจำนวนมาก นอกจากนี้ เราสามารถใช้มันเพื่อสร้างกรณีการใช้งานที่ซับซ้อนของตนเองได้
ดังนั้นเราจึงเห็นว่าภูมิทัศน์ทั้งหมดกำลังพัฒนาไปอย่างรวดเร็วมาก อันที่จริงแล้ว เฟรมเวิร์กเช่น LangChain ปล่อยรุ่นย่อยทุกๆ สองสามวัน
การประยุกต์ใช้ OpenAI
ข้อมูลการฝึกอบรมขนาดใหญ่ของ OpenAI LLM ทำให้พวกเขาสามารถเข้าถึงคลังความรู้ขนาดใหญ่ได้ สิ่งนี้ทำให้เหมาะอย่างยิ่งสำหรับการทำงานเกี่ยวกับกรณีการใช้งานตามเนื้อหา
กรณีการใช้งานบางกรณีที่มีการใช้งานแล้ว ได้แก่ :
- สรุป
- การเพิ่มคุณค่าเนื้อหา
- การสร้างชื่อเรื่อง
- ถ้อยคำใหม่
- การสร้างหลายรูปแบบ เช่น แบบสั้น ทวีต จุดนำเสนอ เป็นต้น
ในกรณีข้างต้น ความสามารถด้านภาษาของ LLM ถูกนำมาใช้เพื่อแก้ไขหรือช่วยเหลืองานที่เกี่ยวข้องกับเนื้อหา
กรณีการใช้งานอื่น ๆ ที่ใช้ความรู้โดยธรรมชาติของ LLM คือ:
- การสร้างเนื้อหาแบบทดสอบ
- แบบสำรวจความคิดเห็นหรือแบบสำรวจ
การส่งผ่านบริบทอินพุตและการตอบคำถามในเรื่องเดียวกันนั้นเป็นงานที่ LLM ค่อนข้างเชี่ยวชาญ ความสามารถนี้ถูกใช้สำหรับเนื้อหาจำนวนมาก เช่น การรับคำตอบในบทความแบบยาวหรือเอกสาร PDF
โซลูชันโดยรวมเกี่ยวข้องกับการสร้างพรอมต์ในรูปแบบทั่วไปต่อไปนี้:
บริบท:
หุบเขา Ziro ในรัฐอรุณาจัลประเทศเป็นที่อยู่อาศัยของชนเผ่า Apatani และเป็นที่รู้จักจากทิวทัศน์หุบเขาที่สวยงามราวกับภาพวาด Ziro อยู่ห่างจากเมืองหลวง Itanagar ประมาณ 167 กม. และการขับรถไปยังเมืองนี้เป็นหนึ่งในเส้นทางขับรถที่สวยงามที่สุดที่คุณจะได้สัมผัสในอรุณาจัลประเทศ หุบเขาล้อมรอบด้วยป่าเขียวขจีและฟาร์มขั้นบันไดที่ดูสวยงามตลอดเวลาของปี เมื่อมองดูลำธารที่ไหลเอื่อยไหลเอื่อยข้างถนน คุณจะรู้สึกถึงความสงบในซีโร ไม่น่าแปลกใจเลยที่หุบเขานี้เป็นหนึ่งในสถานที่ที่มีผู้เข้าชมมากที่สุดในอรุณาจัลประเทศ
ทิวทัศน์อันงดงามของหุบเขา Ziro เป็นหนึ่งในเหตุผลหลักว่าทำไมเทศกาลดนตรี Ziro ประจำปีจึงถูกจัดขึ้นที่นี่ ท่ามกลางทุ่งหญ้าเขียวขจี สถานที่จัดงานเทศกาลนี้เป็นหนึ่งในสถานที่ที่สวยงามที่สุดในอินเดีย ผู้รักเสียงเพลงจากทั่วอินเดียและทั่วโลกมาที่นี่เพื่อร่วมงานเทศกาลและสัมผัสบรรยากาศอันยิ่งใหญ่
คำแนะนำพร้อมท์: ตอบคำถามด้านล่างใน 100 คำจากบริบทที่ให้ไว้ด้านบน
คำถาม: Ziro อยู่ห่างจากเมืองหลวงแค่ไหน?
คำตอบ:
LLM ให้คำตอบสำหรับคำถามจากบริบทที่ให้ไว้ เราต้องเล่นซอรอบ ๆ ด้วยการตั้งค่าที่รวดเร็วเพื่อให้ได้ผลลัพธ์ที่ต้องการ
วิธีการโดยรวมนี้เปิดโลกสำหรับการตอบคำถามของผู้ใช้ตามคลังเนื้อหา ตัวอย่างเช่น คลังข้อมูลที่สร้างขึ้นจากข่าวและบทความเกี่ยวกับงบประมาณสามารถใช้เพื่อตอบคำถามที่ผู้อ่านอาจมี การลัดวงจรนี้ทำให้รูปแบบดั้งเดิมของผู้ใช้ป้อนสตริงการค้นหา จากนั้นจึงแสดงลิงก์บทความจำนวนมาก ซึ่งผู้ใช้จำเป็นต้องอ่านอย่างละเอียดเพื่อให้ได้คำตอบที่ต้องการ สิ่งนี้มอบประสบการณ์การใช้งานที่ดีขึ้นมากและช่วยประหยัดเวลาได้มาก
วิธีการหมุนรอบการให้บริบทที่ถูกต้องแก่ LLM เพื่อให้สามารถตอบคำถามได้ ดังนั้น ปัญหาในตอนนี้คือวิธีระบุชุดข้อมูลโค้ดที่ถูกต้องจากคลังข้อมูลที่เกี่ยวข้องกับข้อความค้นหา เนื่องจากแอป LLM มีข้อจำกัดเกี่ยวกับจำนวนอินพุตที่สามารถส่งได้
นี่เป็นปัญหาหลักในการค้นหาในขณะนี้ เนื้อหาสามารถแบ่งออกเป็นส่วนย่อยและจัดทำดัชนี สามารถใช้ฐานข้อมูลเวกเตอร์เช่น Pinecone หรือ Milvus ได้ เนื้อหาถูกทำให้เป็นเวกเตอร์และจัดเก็บไว้ในฐานข้อมูล เมื่อผู้ใช้ถามคำถาม เพียงแค่ทำให้ข้อความค้นหาเป็นเวกเตอร์และค้นหาความคล้ายคลึงกันเพื่อรับตัวอย่างข้อมูลที่เกี่ยวข้อง
การค้นหาข้อความฟรีที่ชาญฉลาดยิ่งขึ้น
การค้นหาข้อความอิสระนั้นง่ายกว่าจากมุมมองของ UX เมื่อเทียบกับการค้นหาตามตัวกรองแบบดั้งเดิม อย่างไรก็ตาม มันเกี่ยวข้องกับการพัฒนาตรรกะการแยกวิเคราะห์ที่ซับซ้อนเพื่อระบุตัวกรองการค้นหาจากข้อความที่ป้อนโดยผู้ใช้ ดังนั้นจึงมีแนวโน้มที่จะเกิดข้อบกพร่องหรือรูปแบบการป้อนข้อความตายตัวชุดเล็กๆ
สามารถใช้ความสามารถด้านภาษาของ LLM ที่นี่เพื่อแยกวิเคราะห์ข้อความค้นหาและระบุพารามิเตอร์การค้นหา
โซลูชันโดยรวมเกี่ยวข้องกับการสร้างพรอมต์ในรูปแบบทั่วไปต่อไปนี้:
คำแนะนำพร้อมท์: แยกวิเคราะห์คิวรีอินพุตที่ให้ไว้ในรูปแบบ JSON ต่อไปนี้”
รูปแบบ JSON:
{“สถานที่”: “สถานที่ที่หนึ่งกำลังเยี่ยมชม บังคับ” , “checkInDate”: ”วันที่เช็คอินสำหรับการจอง บังคับ. รูปแบบ dd/mm/yyyy", "checkOutDate" : " วันที่เช็คเอาท์สำหรับการจอง บังคับ. เช็คอินเริ่มต้นบวก 2 วัน รูปแบบ dd/mm/yyyy”, “minimumRating”: “การให้คะแนนขั้นต่ำที่จำเป็นสำหรับโรงแรม ไม่บังคับ", "ราคาสูงสุดต่อคืน": "ราคาสูงสุดต่อคืนที่ยินดีจ่าย ไม่จำเป็น" }
ตัวอย่าง:
คำถาม: กำลังมองหาห้องพักตั้งแต่วันที่ 23 กรกฎาคมถึง 28 กรกฎาคมในชิมลาที่มีคะแนนตั้งแต่ 4 ขึ้นไป
คำตอบ: {“สถานที่”: “ชิมลา” , “checkInDate”: ”23/07/2023” “checkOutDate” : “28/07/2023” “minimumRating”: “4”}
คำถาม: กำลังมองหาห้องพักตั้งแต่ 15 ส.ค. เป็นเวลา 3 วันในดาร์จีลิง
คำตอบ: {“สถานที่”: “ดาร์จีลิ่ง” , “checkInDate”: ”15/08/2023” “checkOutDate” : “17/08/2023”}
คำถาม: ไปเที่ยวพอนดิเชอรีเป็นเวลา 5 วันตั้งแต่วันที่ 3 กันยายน
คำตอบ:
ในกรณีนี้ เราใช้ความสามารถของ LLM ที่เรียกว่า Zero Shot Learning นอกเหนือจากคำแนะนำแล้ว เรายังให้ตัวอย่างตัวอย่างบางส่วนเพื่อแสดงผลลัพธ์ที่คาดหวังสำหรับชุดคำถาม LLM ได้แสดงให้เห็นถึงความสามารถที่ยอดเยี่ยมในการปรับพฤติกรรมโดยการเรียนรู้จากกลุ่มตัวอย่างขนาดเล็ก
LLM จะแยกวิเคราะห์ข้อความค้นหาของผู้ใช้และระบุ JSON ในรูปแบบคงที่ จากนั้นสามารถใช้สิ่งเดียวกันนี้เพื่อเพิ่มพลังให้กับฟังก์ชันการค้นหาจริงได้
ในกรณีนี้ LLM เป็นตัวแยกวิเคราะห์ข้อความอัจฉริยะโดยพื้นฐานแล้ว
สนับสนุนบอท
ลองใช้ตัวอย่างแอปพลิเคชันจองการเดินทางเพื่อสำรวจกรณีการใช้งานนี้
ผู้ใช้โต้ตอบกับบอตสนับสนุนเพื่อรับคำตอบสำหรับคำถามเกี่ยวกับวิธีใช้แอปพลิเคชัน หรือประโยชน์ทั่วไป ฯลฯ หรือพวกเขาต้องการได้รับคำตอบเกี่ยวกับธุรกรรมที่ทำบนแอปพลิเคชัน
คลังข้อมูลของแอปพลิเคชัน การใช้งานทั่วไป สามารถสร้างเนื้อหาที่เกี่ยวข้องกับแอปพลิเคชันเพื่อตอบคำถามได้ในตัวเดียวกัน
ในทำนองเดียวกัน ตัวแยกวิเคราะห์แบบสอบถามที่ใช้ LLM อัจฉริยะสามารถใช้เพื่อแยกวิเคราะห์ข้อความค้นหาของผู้ใช้เกี่ยวกับการจอง จากนั้นดึงข้อมูลบันทึกการจอง เนื่องจากแอปพลิเคชันอาจมีธุรกรรมของผู้ใช้หลายประเภท จึงสามารถปรับตัวแยกวิเคราะห์ LLM เพื่อให้ระบุประเภทธุรกรรมรวมถึงพารามิเตอร์สำหรับธุรกรรมนั้นๆ ได้
การรวมฟังก์ชันการทำงานทั้งสองเข้าด้วยกันบนฟรอนท์เอนด์บอทเดียวยังเกี่ยวข้องกับขั้นตอนที่เราต้องระบุว่าอะไรคือความตั้งใจของผู้ใช้ ไม่ว่าคำถามนั้นจะเกี่ยวกับวิธีการทำธุรกรรมหรือสถานะของธุรกรรมล่าสุด ในที่นี้ LLM สามารถใช้ระบุเจตนาของผู้ใช้ได้อย่างถูกต้อง
ดังนั้น การแก้ปัญหาโดยรวมจึงเกี่ยวข้องกับ:
- การระบุเจตนา: Corpus Query หรือ Booking Query
- กำลังประมวลผลข้อความค้นหาคลังข้อมูล
- ค้นหาคลังข้อมูล
- การระบุตัวอย่างที่เกี่ยวข้อง
- เรียกใช้ LLM โดยส่งตัวอย่างข้อมูลที่เกี่ยวข้องและข้อความค้นหาของผู้ใช้
- กำลังประมวลผลการจองคิว
- เรียกใช้ LLM เพื่อระบุประเภทและพารามิเตอร์
- แยกวิเคราะห์การตอบสนอง LLM JSON
- เรียกใช้ฟังก์ชันที่เหมาะสม

LLM มาพร้อมกับความท้าทายในการทำงานด้วย
ตามเนื้อผ้า นักพัฒนาคุ้นเคยกับการทำงานในโลกที่กำหนดขึ้น การตอบสนองจากการเรียกใช้ฟังก์ชันถูกกำหนดขึ้นโดยธรรมชาติ แม้ว่าจะล้มเหลวและทำให้เกิดข้อผิดพลาดก็ตาม
อย่างไรก็ตาม LLM ทำงานในลักษณะที่น่าจะเป็น คำตอบของพวกเขาไม่จำเป็นต้องเป็นไปตามที่เราคาดการณ์เสมอไป ซึ่งหมายความว่าเมื่อพัฒนาแอปพลิเคชันโดยใช้แอปพลิเคชันอย่างสม่ำเสมอ นักพัฒนาจะต้องตระหนักถึงสิ่งนี้อยู่เสมอ และสร้างความยืดหยุ่นที่เหมาะสมเพื่อจัดการกับสิ่งที่ไม่คาดคิด
เวลาตอบสนองของ OpenAI API นั้นละเอียดอ่อนมาก มีระยะเวลาตั้งแต่ 2–12 วินาที มากขึ้นอยู่กับปริมาณของเนื้อหาที่เกี่ยวข้อง ตัวอย่างเช่น การส่งบริบทขนาดใหญ่และการคาดหวังการตอบกลับโดยละเอียดสำหรับแบบสอบถามจะเกี่ยวข้องกับการคำนวณจำนวนมากสำหรับ LLM ดังนั้นเวลาในการตอบสนองจะอยู่ในด้านที่สูงกว่า บางส่วนสามารถจัดการได้อย่างชาญฉลาดโดยเปลี่ยนไปใช้ API ของสตรีมมิ่ง แต่ก็ยังหมายความว่าคำตอบสุดท้ายจะเสร็จสมบูรณ์หลังจากเวลาค่อนข้างสูง เปรียบเทียบกับ SLA เวลาตอบสนองของ API แบบดั้งเดิม
คำแนะนำเป็นวิธีหลักในการแนะนำ LLM เกี่ยวกับสิ่งที่เราต้องการให้ทำ การได้รับคำแนะนำที่ถูกต้องจึงมีความสำคัญอย่างยิ่ง อย่างไรก็ตามมีช่วงการเรียนรู้ที่เกี่ยวข้องเหมือนกัน ยิ่งไปกว่านั้น การแจ้งการทำงานกับ LLM เวอร์ชันหนึ่งจะทำงานแตกต่างกันเล็กน้อยกับอีกเวอร์ชันหนึ่ง โดยต้องมีการปรับแต่งเพื่อทำเช่นเดียวกัน
LLM ในฐานะเทคโนโลยีได้เปิดโอกาสในการคิดค้นวิธีการใหม่ในการแก้ปัญหา เรายังคงเข้าใจศักยภาพที่แท้จริงของมัน แนวคิดใหม่ๆ ที่หลั่งไหลเข้ามาบนอินเทอร์เน็ตทุกวันเป็นเครื่องพิสูจน์ถึงความจริงที่ว่ายังมีช่วงเวลาที่น่าตื่นเต้นรออยู่ข้างหน้า