OpenAI ปรับแต่ง LLM สำหรับการสนทนาด้วย ChatGPT

Dec 02 2022
ChatGPT เปรียบเทียบกับ DaVinci 3 รุ่นใหม่อย่างไร ChatGPT เป็นการใช้งาน KI-NLP หรือไม่ และวิธีที่ OpenAI หลีกเลี่ยงภัยพิบัติที่อาจเกิดขึ้น ตั้งแต่ปี 2020 ฉันได้ค้นคว้าและเขียนเกี่ยวกับ OpenAI และ GPT3… การเปิดตัว ChatGPT จำเป็นต้องได้รับการพิจารณาตามประเด็นต่อไปนี้: ข้อควรพิจารณาที่สำคัญ: ตัวอย่างที่ใช้ได้จริง: ด้านล่าง ฉันถามคำถามสองข้อกับโมเดล DaVinci 3 คำถามที่สองคือ คำถามติดตามผลอาศัยบริบทจากคำถามแรก: ฉันจะสร้างแชทบอทได้อย่างไร ฉันควรใช้เทคโนโลยีอะไร การตอบสนองมีรายละเอียดมากขึ้น เรียงลำดับและจัดลำดับได้ดีใน Davinci 3 มากกว่าในรุ่น Davinci 2 หรือ Davinci 1

ChatGPT เปรียบเทียบกับDaVinci 3 รุ่น ใหม่อย่างไร ? ChatGPT เป็นการใช้งาน KI-NLP หรือไม่ และวิธีที่ OpenAI หลีกเลี่ยงภัยพิบัติที่อาจเกิดขึ้น

ตั้งแต่ปี 2020ฉันได้ทำการค้นคว้าและเขียนเกี่ยวกับOpenAIและ GPT3...

การเปิดตัว ChatGPT จะต้องพิจารณาจากประเด็นต่อไปนี้:

ข้อควรพิจารณาที่สำคัญ:

  • เมื่อพิจารณาจากตัวอย่างด้านล่าง ดูเหมือนว่าOpenAI langauge APIจะสามารถเข้าถึงอินเทอร์เน็ตและสามารถดึงคำตอบกลับมาได้
  • ChatGPTไม่สามารถเข้าถึงอินเทอร์เน็ตเพื่อดึงข้อมูล และดูเหมือนว่าจะเป็นการดำเนินการของKnowledge Intensive Natural Language Processing (KI-NLP )
  • KI-NLP คืออะไร? เป็นโดเมนที่กว้างมาก ส่วนต่อประสานที่เน้นความรู้สำหรับงานตอบคำถามหรืองานตรวจสอบข้อเท็จจริง เรียกโดยรวมว่าการประมวลผลภาษาธรรมชาติที่เน้นความรู้ (KI-NLP)
  • โมเดล AI ที่สนับสนุนโดยเฟรมเวิร์ก KI-NLP จะค้นหาข้อมูลที่เกี่ยวข้อง ผ่าน ไฟล์เก็บถาวรดิจิทัล ยิ่งคลังดิจิทัลครอบคลุมมากเท่าใด คำตอบก็จะยิ่งกว้างและถูกต้องมากขึ้นเท่านั้น
  • ระบบ KI-NLP อยู่ในตัวเองและไม่ค้นหาอินเทอร์เน็ตหรือใช้ประโยชน์จาก API ความรู้
  • OpenAI ตรวจสอบให้แน่ใจว่า ChatGPT ไม่ได้เรียนรู้นิสัยที่ไม่ดีจากเนื้อหาอินเทอร์เน็ตที่น่าสงสัยหรือการป้อนข้อมูล ของผู้ใช้ที่ขัดแย้ง เช่นในกรณีของBlender Bot

ตัวอย่างการปฏิบัติ:

ด้านล่างฉันถาม คำถาม สองข้อกับโมเดล DaVinci 3 คำถามที่สองเป็นคำถามติดตามผลที่อาศัยบริบทจากคำถามแรก:

How do I create a chatbot?

What technology should I use?

DaVinci 3 Generative Model (ภาษา API)

การตอบสนองมีรายละเอียดมากขึ้น เรียงลำดับและจัดลำดับได้ดีในDavinci 3 มากกว่าในรุ่นDavinci 2หรือDavinci 1 อ่านเพิ่มเติมเกี่ยวกับการเปรียบเทียบนั้นได้ที่นี่

อย่างไรก็ตาม การถามคำถามสองข้อเดียวกันนี้ใน ChatGPT เป็นที่ชัดเจนว่าคำตอบนั้นมีการสนทนาและครอบคลุมมากกว่ามาก

ChatGPT

ในตัวอย่างที่สองนี้ ฉันถามคำถามสามข้อ:

Who is Peter Thiel?

Where does he live?

How old is he?

Davinci 3 generative model จัดการการเปลี่ยนบทสนทนา สถานะ และบริบทได้เป็นอย่างดี

DaVinci 3 Generative Model (ภาษา API)

ด้านล่าง คุณจะเห็นคำตอบสำหรับคำถามสามข้อเดียวกันจาก ChatGPT...ชัดเจนว่ามีการป้องกันความสมบูรณ์ของ ChatGPT...แต่ก็เห็นได้ชัดว่า ChatGPT เป็น LLM ในตัวหรือการใช้งาน KI-NLP

ChatGPT

ความคิดสุดท้ายบางอย่าง

  • ChatGPT เป็นการผสมผสานองค์ประกอบทั้งสี่รายการด้านล่าง ได้แก่ การจัดการกล่องโต้ตอบ การสร้าง คำถามและคำตอบ และการแปลภาษา
  • นี่คือการแปลที่สมบูรณ์แบบจากภาษาแอฟริกาเป็นภาษาอังกฤษจาก ChatGPT ChatGPT ตรวจพบภาษาโดยอัตโนมัติและแปลเฉพาะประโยคที่ถูกต้องเท่านั้น
  • ChatGPT API จะต้องถูกเปิดเผยสำหรับการใช้งานจริง ซึ่งไม่สามารถใช้งานได้ในขณะนี้
  • การปรับละเอียดเป็นข้อพิจารณาสำหรับการใช้งานในองค์กร
  • และเกี่ยวข้องกับการปรับแต่ง วิธีการผสมผสานความรู้เฉพาะน่าจะอยู่ในแผนการทำงานมากที่สุด

ตอนนี้ฉันเป็นหัวหน้าผู้สอนศาสนา @ HumanFirst ฉันสำรวจและเขียนเกี่ยวกับทุกสิ่งที่จุดตัดของ AI และภาษา ตั้งแต่LLMs , Chatbots , Voicebots , Development Frameworks , Data-Centric Latent Spaceและอื่นๆ

https://www.linkedin.com/in/cobusgreyling
Cobus Quadrant™ ของการออกแบบ NLU Cobus Quadrant™ ของความสามารถในการออกแบบการสนทนา
การใช้ AI เป็นศูนย์กลางข้อมูลสำหรับโมเดล NLU