BARD VS ChatGPT: การทดสอบปัญหาการวิเคราะห์

May 15 2023

ความแตกต่าง ความเหมือน และการทดสอบทั้งแบบจำลองภาษาและการเปรียบเทียบ

เราสามารถเชื่อมต่อกับ :| ลิงค์ดิน | ทวิตเตอร์ | ปานกลาง | กองย่อย | เมื่อวันที่ 10 พฤษภาคม BARD ซึ่งเป็นคู่แข่งที่แข็งแกร่งและแข็งแกร่งที่สุดของ Google ต่อ ChatGPT ได้เผยแพร่ในอินเดีย ความหลงใหลของฉันไม่ได้ทำให้ฉันหยุดเปรียบเทียบ Bard กับ ChatGPT และนี่คือการเปรียบเทียบที่ยอดเยี่ยมบางส่วน

เครดิตรูปภาพ: ที่นี่

เมื่อวันที่ 10 พฤษภาคม BARDซึ่งเป็นคู่แข่งที่แข็งแกร่งและแข็งแกร่งที่สุดของ Google ต่อ ChatGPT ได้เผยแพร่ในอินเดีย ความหลงใหลของฉันไม่ได้ทำให้ฉันหยุดเปรียบเทียบ Bard กับ ChatGPT และนี่คือการเปรียบเทียบที่ยอดเยี่ยมบางส่วน

ในบล็อกนี้ ฉันกำลังเปรียบเทียบChatGPT ที่ใช้ GPT 3กับ BARD ไม่ใช่ GPT4 Google Bard และ ChatGPT เป็นโมเดลภาษาขนาดใหญ่ทั้งคู่ แต่มีความแตกต่างที่สำคัญบางประการ Google Bard มีขนาดใหญ่ขึ้นและได้รับการฝึกอบรมเกี่ยวกับชุดข้อมูลที่หลากหลายมากขึ้น ซึ่งให้ความรู้และความสามารถที่หลากหลายยิ่งขึ้น ChatGPT มีขนาดเล็กกว่าและได้รับการฝึกอบรมในชุดข้อมูลที่จำกัดมากขึ้น ซึ่งทำให้มีความแม่นยำและสร้างสรรค์น้อยลง อย่างไรก็ตาม ChatGPT ก็มีราคาไม่แพงและให้บริการอย่างกว้างขวางมากกว่า Google Bard

นี่คือตารางที่เปรียบเทียบ Google Bard และ ChatGPT:

ภาพโดยผู้เขียน

พอทฤษฎีและข้ออ้าง. ลองตรวจสอบผลลัพธ์จริง

การเปรียบเทียบ (จริง):

มีวิธีการเปรียบเทียบหลายวิธี แต่ฉันมักจะชอบการเปรียบเทียบความสามารถในการวิเคราะห์ ทักษะการวิเคราะห์เป็นปัจจัยหลักในการจำแนกความแตกต่างระหว่างมนุษย์กับระบบ เนื่องจากการสร้างกระบวนการคิด การมีส่วนร่วมในการใช้เหตุผล และการตอบคำถามในภายหลังอาจก่อให้เกิดความท้าทายมากขึ้นสำหรับแบบจำลองทางภาษา ให้เราตรวจสอบผลลัพธ์ต่อไป

คำถามที่ 1:

ถ้า 1=3, 2=3, 3=5, 4=4, 5=4,แล้ว 6=?

ChatGPT

กวี

ChatGPT ไม่เข้าใจความสัมพันธ์ระหว่างตัวเลข แม้ว่ามันจะยากสำหรับ BARD แต่ในย่อหน้าแรก BARD ก็ตอบได้อย่างถูกต้อง

คำถามที่ 2:

มีสุนัข 49 ตัวลงทะเบียนเข้าร่วมการแสดงสุนัข มีสุนัขตัวเล็กมากกว่าสุนัขตัวใหญ่ถึง 36 ตัว มีสุนัขขนาดเล็กกี่ตัวที่สมัครเข้าแข่งขัน?

คำตอบ:ในการหาจำนวนสุนัขตัวเล็กที่แข่งขันกัน คุณต้องลบ 36 ออกจาก 49 แล้วหารคำตอบนั้น 13 คูณ 2 เพื่อให้ได้สุนัข 6.5 ตัวหรือจำนวนสุนัขตัวใหญ่ที่แข่งขันกัน แต่คุณยังไม่เสร็จ! จากนั้นคุณต้องบวก 6.5 ถึง 36 เพื่อให้ได้จำนวนสุนัขตัวเล็กที่แข่งขัน ซึ่งก็คือ 42.5 แน่นอนว่าเป็นไปไม่ได้ที่สุนัขครึ่งตัวจะแข่งขันในการแสดงสุนัข แต่เพื่อแก้ปัญหาทางคณิตศาสตร์นี้ สมมติว่าเป็นเช่นนั้น

ChatGPT

กวี

ในคำถามนี้ ทั้งสองรุ่นทำงานได้ดี ทั้งคู่มีเหตุผลที่ดีและ COT สำหรับการทำงานหาคำตอบ

คำถามที่ 3:

ชายคนหนึ่งกำลังปีนขึ้นไปบนภูเขาที่ลาดเอียง เขาต้องเดินทาง 100 กม. เพื่อไปยังยอดเขา ทุกวันเขาปีนขึ้นไป 2 กม. ไปข้างหน้าในเวลากลางวัน หมดเรี่ยวแรงก็พักผ่อนในราตรีนั้น. ตกกลางคืนหลับไหลถอยร่นไป 1 กม. เพราะภูเขาเอียง แล้วต้องใช้เวลากี่วันจึงจะถึงยอดดอย?

ตอบ ความสูงของวันแรกทำได้ 2 กม

คืนแรก -1 กม

การไต่ที่มีประสิทธิภาพเมื่อเริ่มต้นวันที่ 2 คือ 1 กม

ความสูงวันที่ 2 ทำได้ 3 กม

คืนที่ 2 -1 กม

การปีนที่มีประสิทธิภาพในตอนต้นของวันที่ 3 คือ 2 กม

เร็วๆ นี้…

การไต่ที่มีประสิทธิภาพในตอนต้นของวันที่ 98 คือ 97 กม

ความสูงวันที่ 98 ทำได้ 99 กม

คืนที่ 98 -1กม

การไต่ที่มีประสิทธิภาพเมื่อเริ่มต้นวันที่ 99 คือ 98 กม

ความสูงวันที่ 99 ทำได้คือ 100 กม

ChatGPT

กวี

โจทย์นี้ BARD ได้เลย มีเคล็ดลับที่ GPT ไม่เข้าใจ

คำถามที่ 4:

คนสามคนมีแนวโน้มที่จะโกหก 1/3 ของเวลา มีการพลิกเหรียญที่พวกเขาทุกคนเห็น ทุกคนบอกว่ามันคือเฮดส์ ความน่าจะเป็นที่มันจะเป็นหัวคืออะไร?

คำตอบ:โดยทั่วไป มีโอกาส (1/3)*(1/3)*(1/3) = 1/27 ที่ทั้งหมดจะโกหก และ a (2/3)*(2/3)*(2 /3) = 8/27 โอกาสที่พวกเขาพูดความจริงทั้งหมด เนื่องจากเรารู้ว่าพวกเขาทั้งหมดให้คำตอบเดียวกัน นี่เป็นเพียงสองตัวเลือกเท่านั้น ดังนั้น ความน่าจะเป็นที่จะออกหัว (ทุกคนพูดความจริง) คือ: (8/27)/ ((8/27)+(1/27)) = 8/9

ChatGPT

กวี

น่าสนใจ! เกมแห่งความน่าจะเป็น !!! BARD ตอบได้ดีอีกครั้ง

ในทำนองเดียวกัน ฉันได้ทดสอบคำถามมากมายสำหรับคณิตศาสตร์วิเคราะห์ และพบว่าBARD นั้นเหนือกว่าตามที่กล่าวอ้าง ถึงกระนั้น อาจมีเรื่องราวที่แตกต่างกันเมื่อเราแทนที่GPT3 ด้วย GPT 4การต่อสู้ของ BARD และ GPT4 ในรูปแบบเดียวกัน ฉันจะทำการเปรียบเทียบในไม่ช้า

ท้ายที่สุดแล้ว ตัวเลือกที่ดีที่สุดสำหรับคุณจะขึ้นอยู่กับความต้องการและข้อกำหนดเฉพาะของคุณ หากคุณต้องการโมเดลภาษาขนาดใหญ่ที่มีความรู้และความสามารถที่หลากหลาย Google Bard เป็นตัวเลือกที่ดีกว่า หากคุณกำลังมองหารูปแบบภาษาที่เล็กลงและราคาไม่แพง ChatGPT เป็นตัวเลือกที่ดี

คุณสามารถทดสอบทั้งสองรุ่นตามประสิทธิภาพเฉพาะและเอกสารของคุณ

ChatGPT: คลิกที่นี่

บาร์ด: คลิกที่นี่

หากคุณพบว่าบทความนี้มีสาระ

เป็นที่พิสูจน์แล้วว่า “ ความเอื้ออาทรทำให้คุณเป็นคนที่มีความสุขมากขึ้น ”; ดังนั้น ตบมือให้บทความถ้าคุณชอบ หากคุณพบว่าบทความนี้มีสาระ โปรดติดตามฉันที่Linkedinและสื่อ คุณยังสามารถสมัครรับการแจ้งเตือนเมื่อฉันเผยแพร่บทความ มาสร้างชุมชนกันเถอะ! ขอบคุณสำหรับการสนับสนุน!

คุณสามารถอ่านบล็อกอื่น ๆ ของฉันที่เกี่ยวข้องกับ:

การเรียนรู้โมเดลภาษาขนาดใหญ่อย่างเชี่ยวชาญ: ตอนที่ 1 การแปลงข้อมูลเป็นรูปแบบ SQuAD สำหรับการปรับแต่งโมเดล LLM

ติดตามข่าวสารล่าสุดและการอัปเดตในพื้นที่ AI ที่สร้างสรรค์ ติดตามสิ่งพิมพ์Generative AI