เหตุใด UX จึงเป็นสนามรบสำหรับอนาคตของ AI

Nov 25 2022
สำหรับผู้ที่ยังใหม่กับพื้นที่นี้ เรากำลังอยู่ระหว่างการเปลี่ยนแปลงทางเทคโนโลยีครั้งใหญ่ที่สุดครั้งหนึ่งนับตั้งแต่การประมวลผลแบบคลาวด์ ฉันจะไม่ใช้เวลามากเกินไปในการเปลี่ยนแปลงนี้ เนื่องจากมีการเผยแพร่บทสรุปและแผนที่ตลาดที่ยอดเยี่ยมมากมาย แต่นี่คือสไลด์ที่ฉันทำขึ้นเพื่อสรุปสิ่งที่เกิดขึ้น

สำหรับผู้ที่ยังใหม่กับพื้นที่นี้ เรากำลังอยู่ระหว่างการเปลี่ยนแปลงทางเทคโนโลยี ครั้งใหญ่ที่สุดครั้งหนึ่ง นับตั้งแต่การประมวลผลแบบคลาวด์ ฉันจะไม่ใช้เวลามากเกินไปในการเปลี่ยนแปลงนี้ เนื่องจากมี การเผยแพร่ บทสรุปและแผนที่ตลาด ที่ยอดเยี่ยมมากมาย แต่นี่คือสไลด์ที่ฉันทำขึ้นเพื่อสรุปสิ่งที่เกิดขึ้น

คำถามหนึ่งที่มักเกิดขึ้นเมื่อสำรวจการระเบิดแคมเบรียนของแอปพลิเคชันที่ขับเคลื่อนด้วย AI คือการป้องกัน เนื่องจากนักลงทุนและผู้ก่อตั้งตระหนักดีว่าโมเดล AI กำลังกลายเป็นสินค้าโภคภัณฑ์ ดังนั้นมูลค่าของโครงข่ายประสาทเทียมในแอปพลิเคชัน AI จึงลดลงอย่างรวดเร็ว

โมเดลเหล่านี้ได้รับการเผยแพร่โดยบริษัทต่างๆเช่นOpenAIและStability.ai หากคุณยังไม่เคยลองกับ GPT-3 (โมเดลที่โฮสต์โดย OpenAI) เราขอแนะนำให้คุณลองเล่นดู เพื่อที่คุณจะได้ชื่นชมพลังวิเศษของโมเดลที่วางขายทั่วไป เป็นที่น่าสังเกตว่าแม้ว่าคุณจะต้องการสร้างโมเดลของคุณเอง แต่ปัจจุบันก็กลายเป็นเรื่องยากขึ้นเรื่อยๆ เนื่องจากการวิจัย AI กำลังกลายเป็นส่วนหนึ่งของความแข็งแกร่งของงบดุล

NLP ก้าวหน้าไปมากในทศวรรษที่ผ่านมา - เครือข่าย LSTM เพิ่มประสิทธิภาพของ RNN อย่างมากมาย เนื่องจากความสามารถในการเลือกจำหรือลืมส่วนต่างๆ ของลำดับ จากนั้น Transformers และ "กลไกการให้ความสนใจ" (ควบคู่ไปกับกฎหมายมาตราส่วน) ทำให้เกิดการเปลี่ยนแปลงขั้นตอนในสิ่งที่เป็นไปได้เมื่อแบบจำลองเหล่านี้เริ่มเข้าใจภาษาอย่างแท้จริง ตอนนี้ Diffusion Models กำลังปรับเปลี่ยนวิธีการสร้างเนื้อหาในทุกรูปแบบ เคยมีกรณีที่ความก้าวหน้าในการเรียนรู้เชิงลึกถูกนำมาใช้เพื่อสร้างความได้เปรียบในการแข่งขัน อย่างไรก็ตาม มีการเปลี่ยนแปลงทางวัฒนธรรมและเทคโนโลยี (การกอดใบหน้ามีส่วนสำคัญ) ในการนำโมเดลที่ได้รับการฝึกฝนล่วงหน้าเหล่านี้มาเปิดเผย ตอนนี้นักพัฒนาสามารถฝัง AI ที่ทันสมัยลงในผลิตภัณฑ์ของตนได้ด้วยโค้ดไม่กี่บรรทัด

แต่คุณจะสร้างความได้เปรียบในการแข่งขันได้อย่างไรในเมื่อทุกคนใช้โมเดลเดียวกัน

เป็นเจ้าของ UX

เราเพิ่งเริ่มเข้าใจถึงพลังที่ซ่อนอยู่ภายในพื้นที่แฝงของโมเดลขนาดใหญ่เหล่านี้ ยิ่งคุณสามารถจัดเตรียมบริบทให้กับโมเดลเหล่านี้ได้มากเท่าไร ก็ยิ่งดีขึ้นเท่านั้น และจะสามารถกลายเป็นงานที่ดี ได้อย่างรวดเร็ว ซึ่งก่อนหน้านี้ต้องใช้วิศวกรรมที่แข็งแกร่งจำนวนมาก คำถามหนึ่งที่ต้องถามคือ " อินเทอร์เฟซเดียวสำหรับโมเดลที่ทรงพลังเหล่านี้จะเป็นกล่องข้อความแบบคงที่และเรียบง่ายตลอดไปหรือไม่ ".

ผู้บริโภคส่วนใหญ่ไม่ตระหนักถึง AI มากนัก ดังนั้นการทำให้พวกเขาอยู่หน้าโมเดลแทบจะไม่ช่วยพวกเขาในการแก้ปัญหาเลย การออกแบบ UX เป็นปัญหาใหญ่ ( และอาจเป็นปัญหาใหญ่ที่สุด) ในผลิตภัณฑ์ AI ในปัจจุบัน

ต้องให้ความสำคัญกับเวิร์กโฟลว์ที่ครอบคลุมเพื่อช่วยรวบรวมบริบทที่จำเป็นจากผู้ใช้สำหรับข้อความแจ้งที่เหมาะสมที่สุด นอกจากนี้ยังต้องมีเวิร์กโฟลว์ที่ใช้งานง่ายสำหรับการรวบรวมข้อมูลความคิดเห็นสำหรับการปรับแต่งโมเดลอย่างละเอียดเพื่อสร้างคูน้ำเพิ่มเติม

มีช่องว่างขนาดใหญ่ระหว่างช่วงเวลา "ว้าว" ของโมเดลเชิงสร้างสรรค์กับการทำให้ใครบางคนกลายเป็นผู้ใช้ที่จ่ายเงิน ช่องว่างส่วนใหญ่นี้เต็มไปด้วย UX ที่ยอดเยี่ยม Jasper.ai เป็นตัวอย่างที่ดีของบริษัทที่ดำเนินการในเรื่องนี้ และขณะนี้มีข่าวลือว่า ARR เข้าใกล้ $80m ซึ่งเพิ่งเปิดตัวเมื่อปีที่แล้ว

ใช้ประโยชน์จากพรอมต์เอ็นจิเนียริ่ง

ขณะนี้มีผืนผ้าใบว่างเปล่าเมื่อพิจารณาว่าเราโต้ตอบกับ AI อย่างไร ซึ่งนำไปสู่การเปลี่ยนโฟกัสไปที่ Prompt Engineering แทนแบบจำลองทางสถิติ ซึ่งหมายความอย่างกว้างๆ ว่าวิศวกรรมข้อมูลที่คุณป้อนให้กับโมเดล เพิ่มประสิทธิภาพเพื่อความสะดวก ความ แม่นยำและต้นทุน ตัวอย่างบางส่วนคือ:

  • Zero-Shot — การแจ้งด้วยภาษาธรรมชาติราวกับว่าคุณกำลังขอให้เด็กวัยหัดเดิน (ซึ่งอ่านวิกิพีเดียเกือบทั้งหมด) ทำบางสิ่ง เช่น อินพุตจะเป็น "คำอธิบายงาน":{target text} นี่เป็นวิธีที่ง่ายที่สุดในการโต้ตอบกับ AI
  • Few-Shot — เพิ่มตัวอย่างบางส่วนและบริบทบางส่วนเกี่ยวกับผลลัพธ์ที่คาดหวัง (ดูภาพด้านล่าง) สิ่งนี้ต้องการ "วิศวกรรม" มากขึ้น แต่สามารถปรับปรุงความแม่นยำได้อย่างมาก อย่างไรก็ตาม การเพิ่มบริบทในแต่ละพรอมต์หมายความว่าอาจมีค่าใช้จ่ายเพิ่มขึ้นมาก (รายละเอียดเพิ่มเติมด้านล่าง)
  • การปรับแต่ง —ใช้ตัวอย่างจำนวนมาก (หลายร้อยหรือหลายพัน) ตัวอย่างและฝึกซ้ำแบบจำลองที่ผ่านการฝึกอบรมล่วงหน้าเพื่อเปลี่ยนพารามิเตอร์โดยที่คุณไม่ต้องรวมตัวอย่างในแต่ละพรอมต์อีกต่อไป กระบวนการนี้อาจมีราคาแพงมากและอาจมีค่าใช้จ่ายหลายล้านดอลลาร์ แต่เมื่อทำเสร็จแล้วก็เสร็จสิ้น
ที่มา: OpenAI — โมเดลภาษาเป็นผู้เรียนเพียงไม่กี่คน

เน้นกรณีการใช้งาน

AI กำลังกลายเป็นแพลตฟอร์ม คล้ายกับคลาวด์หรือมือถือ มีหลายบริษัทที่มุ่งเน้นไปที่การสร้างแพลตฟอร์มนั้น และไม่ต้องสงสัยเลยว่าพวกเขาจะมีมูลค่ามหาศาล ซึ่งเห็นได้จากการประเมินมูลค่าของ OpenAI มูลค่า 2 หมื่นล้านดอลลาร์ อย่างไรก็ตาม มีเหตุผลหนึ่งที่ AWS ไม่มุ่งเน้นไปที่การสร้างโซลูชัน SaaS แนวตั้ง — เป็นการยากมากที่จะมุ่งเน้นไปที่ทั้งการสร้างแพลตฟอร์มและการสร้างกรณีการใช้งานบนแพลตฟอร์มนั้น ซึ่งเห็นได้จากแอปธรรมดาๆ ของ Apple เราเชื่อว่ามีมูลค่ามหาศาลที่จะได้รับการปลดล็อกโดยมุ่งเน้นไปที่กรณีการใช้งานและแอปพลิเคชัน AI ที่เฉพาะเจาะจง คล้ายกับวิธีที่โมเดลธุรกิจ Uber ถูกปลดล็อกด้วยมือถือ

อย่างไรก็ตาม กรณีธุรกิจนี้ต้องใช้เกลือเล็กน้อย มีกรณีการใช้งานมากมายของ AI ที่อยู่ในถัง "คุณลักษณะ" แทนที่จะเป็นผลิตภัณฑ์เต็มรูปแบบ PhotoRoomที่เราร่วมมือด้วยเมื่อเร็วๆ นี้ เป็นหนึ่งในบริษัทแรกๆ ที่ใช้ประโยชน์จาก Stable Diffusion ในการสร้างฟีเจอร์ AI ที่ใช้งานได้จริงและตอนนี้ได้เร่งการเติบโต บริษัทขนาดใหญ่หลายแห่งเช่น NotionและMicrosoftกำลังใช้ประโยชน์จากโมเดลที่มีอยู่ทั่วไปเพื่อปรับปรุงผลิตภัณฑ์ของตน ซึ่งแสดงให้เห็นว่ากลยุทธ์ในการเป็นเจ้าของ UI และวิศวกรรมที่ทันท่วงที แทนที่จะสร้างโมเดลของคุณเองนั้นดูเหมือนจะได้ชัยชนะ

ฉันควรเตือนด้วยว่าในบางสถานการณ์ การเป็นเจ้าของโมเดลและสร้าง AI ตั้งแต่เริ่มต้นก็สมเหตุสมผล พื้นที่หนึ่งที่น่าตื่นเต้นเป็นพิเศษคือในDecision Transformersและใช้ประโยชน์จากสถาปัตยกรรมแบบจำลองที่ล้ำสมัยเพื่อสร้างการดำเนินการมากกว่าเนื้อหาเพียงอย่างเดียว Adept.aiเป็นบริษัทที่ยอดเยี่ยมที่ทำสิ่งนี้ ฉันจะสำรวจเพิ่มเติมในโพสต์อื่น ...

ทำความเข้าใจกับ Model-nomics

OpenAI เรียกเก็บเงิน 0.02 ดอลลาร์ต่อ 1,000 โทเค็น (ประมาณ 750 คำ) และลดลงจาก 0.06 ดอลลาร์ในช่วงฤดูร้อนนี้ เมื่อใช้การเรียนรู้แบบไม่กี่ช็อต มากถึง 90% ของพรอมต์สามารถเป็น "บริบท" ได้ ซึ่งหมายความว่าค่าใช้จ่ายอาจสูงถึง ~10 เท่าของค่า Zero-shot ธุรกิจที่ชาญฉลาดสามารถสร้างความได้เปรียบโดยการปรับอัตราส่วน "บริบท" เทียบกับ "ข้อความเป้าหมาย" ให้เหมาะสม และทำสิ่งที่ชาญฉลาด เช่น ลบคำใดๆ ออกจาก "ข้อความเป้าหมาย" ที่ไม่ส่งผลกระทบต่อผลลัพธ์

เป็นที่ชัดเจนว่าธุรกิจที่สร้างขึ้นบนโมเดลของบุคคลที่สามมีความเสี่ยงด้านราคาในลักษณะเดียวกับที่ธุรกิจที่สร้างบนคลาวด์มีความเสี่ยงด้านราคาสำหรับผู้ให้บริการคลาวด์ เราเชื่อว่า AI จะพบความสมดุลแบบเดียวกับที่คลาวด์มี โดยมูลค่าที่สร้างขึ้นนั้นสมเหตุสมผลสำหรับการจ่ายเงินสำหรับความคล่องตัวและพลังที่ได้รับจากบริษัทบุคคลที่สาม เช่น OpenAI ธุรกิจ AI ในระยะเริ่มต้นจำนวนมากที่เราพบสามารถดำเนินการได้โดยมีอัตรากำไรขั้นต้นที่ 70–80% และเราคิดว่าสิ่งนี้จะเพิ่มขึ้นเนื่องจากพวกเขาสามารถเพิ่มคุณค่าที่นำเสนอได้ในอนาคต

นอกจากนี้ เป็นที่น่าสังเกตว่าการประมวลผลบนคลาวด์ส่วนใหญ่มีไว้สำหรับกรณีการใช้งานการเรียนรู้เชิงลึกอยู่แล้ว นี่เป็นสัญญาณว่าสถานะการกำหนดราคาคงที่สำหรับแพลตฟอร์ม AI อาจอยู่ในภูมิภาคเดียวกับการประมวลผลบนคลาวด์ในปัจจุบัน ซึ่งธุรกิจส่วนใหญ่ดูเหมือนจะโอเค

มีความเป็นไปได้จริงที่พลังการประมวลผลจะตามทันการขยายโมเดลเพื่อให้โมเดลที่ทันสมัยที่สุด (หรืออย่างน้อยก็ใกล้เคียง ที่สุด ) สามารถรันบนอุปกรณ์ได้ ซึ่งนั่นหมายความว่าต้นทุนส่วนเพิ่มของ AI มีแนวโน้มเป็นศูนย์ Stability.ai สามารถเรียกใช้โมเดลบางรุ่นบนอุปกรณ์ได้แล้ว ซึ่งในที่สุดอาจทำให้ต้นทุนส่วนเพิ่มลดลงเหลือศูนย์สำหรับงานบางอย่าง นอกจากนี้ยังมีแพลตฟอร์ม AI จำนวนมากขึ้น ( Cohere , AI21ฯลฯ …) ซึ่งหลายแห่งเลือกที่จะเปิดแหล่งที่มาของโมเดลของตน นอกจากนี้ยังควรกล่าวถึงว่ามีวิธีที่ชาญฉลาดในการลดต้นทุนเช่น การกลั่นแบบจำลอง

ซึ่งจำกัดอำนาจการกำหนดราคาโดยรวม และอาจต้องคิดโมเดลธุรกิจที่สร้างสรรค์มากขึ้น นอกเหนือจากการเรียก API เพื่อสร้างรายได้จากการวิจัย

บทสรุป

หากตลาดมีขนาดใหญ่พอ เราเชื่อว่ามีความเป็นไปได้สูงที่ธุรกิจสตาร์ทอัพจะพลิกโฉมด้วยการสร้างแอปพลิเคชันตั้งแต่ต้น โดยมีโมเดลที่หาซื้อได้ตามร้านค้าเป็นแกนหลัก ตัวอย่างเช่นGongและOtterเป็นบริษัทที่ยอดเยี่ยมสองแห่งที่สร้างผลิตภัณฑ์นอกเหนือจากโมเดลการถอดความที่เป็นกรรมสิทธิ์

ตอนนี้โมเดลการถอดเสียงที่ล้ำสมัยได้เปิดให้ใช้งานแล้ว และต้นทุนของ AI มีแนวโน้มเป็นศูนย์ จึงเป็นสนามแข่งขันที่เสมอภาค สิ่งนี้ได้เปิดโอกาสที่ยิ่งใหญ่สำหรับสตาร์ทอัพในการคว้ามูลค่าในตลาดการผลิตขนาดใหญ่ด้วยการเป็นเจ้าของเลเยอร์ UX และ Prompt Engineering หากคุณเป็นผู้ก่อตั้งที่ใช้ประโยชน์จาก AI เรายินดีที่จะพูดคุยกับคุณ — อย่าลังเลที่จะติดต่อเราได้ที่[email protected]

โพสต์บล็อก AI ที่ไม่มีรูปภาพที่สร้างโดย AI คืออะไร (DALL.E 2)