Tại sao UX là chiến trường cho tương lai của AI

Nov 25 2022

Đối với những người mới sử dụng không gian này, chúng tôi đang trải qua một trong những thay đổi công nghệ lớn nhất kể từ điện toán đám mây. Tôi sẽ không dành quá nhiều thời gian cho sự thay đổi này vì đã có rất nhiều bản tóm tắt và bản đồ thị trường tuyệt vời được xuất bản nhưng đây là một slide tôi đã thực hiện để tóm tắt những gì đang diễn ra.

Một câu hỏi thường xuất hiện khi khám phá sự bùng nổ kỷ Cambri gần đây của các ứng dụng do AI cung cấp là khả năng phòng thủ . Điều này là do các nhà đầu tư và người sáng lập nhận thức rất rõ rằng các mô hình AI đang trở nên hàng hóa nên giá trị của mạng thần kinh trong ứng dụng AI đang giảm nhanh chóng.

Các mô hình này đã được phát hành rộng rãi bởi các công ty như OpenAI và Stability.ai . Nếu bạn chưa thử với GPT-3 (một mô hình do OpenAI lưu trữ), tôi thực sự khuyên bạn nên làm như vậy, vì vậy bạn có thể đánh giá cao sức mạnh gần như kỳ diệu của các mô hình có sẵn. Điều đáng chú ý là ngay cả khi bạn muốn xây dựng các mô hình của riêng mình thì điều đó ngày càng trở nên khó khăn, vì nghiên cứu AI đang trở thành một chức năng của sức mạnh bảng cân đối kế toán.

NLP đã tiến bộ rất nhiều trong thập kỷ qua — mạng LSTM đã tăng đáng kể hiệu suất của RNN nhờ khả năng ghi nhớ hoặc quên có chọn lọc các phần khác nhau của chuỗi. Sau đó, Transformers và “cơ chế chú ý” (cùng với các quy luật mở rộng) đã tạo ra một bước thay đổi trong khả năng có thể khi các mô hình này bắt đầu thực sự hiểu ngôn ngữ. Giờ đây, các Mô hình khuếch tán đang định hình lại cách chúng tôi có thể tạo nội dung ở mọi dạng. Đã từng có trường hợp những đột phá trong deep learning được sử dụng để xây dựng lợi thế cạnh tranh, tuy nhiên, đã có sự thay đổi về văn hóa và công nghệ ( Hugging Face đóng một vai trò quan trọng) trong việc đưa những mô hình được đào tạo trước này ra thị trường. Giờ đây, các nhà phát triển có thể nhúng AI tiên tiến nhất vào sản phẩm của họ bằng một vài dòng mã.

Nhưng làm thế nào để bạn xây dựng lợi thế cạnh tranh khi mọi người đang sử dụng các mô hình giống nhau?

Sở hữu UX

Chúng ta chỉ mới bắt đầu hiểu được sức mạnh ẩn chứa trong không gian tiềm ẩn của những mô hình lớn này. Bạn có thể cung cấp càng nhiều ngữ cảnh cho các mô hình này, thì chúng càng trở nên tốt hơn và chúng có thể nhanh chóng trở nên rất giỏi trong các nhiệm vụ mà trước đây đòi hỏi một lượng lớn kỹ thuật mạnh mẽ. Một câu hỏi được đặt ra là “ Liệu giao diện duy nhất cho những mô hình mạnh mẽ này có mãi mãi là một hộp văn bản tĩnh, đơn giản không? ”.

Hầu hết người tiêu dùng không nhận thức được AI nên việc chỉ đặt họ trước một mô hình sẽ rất hiếm khi giúp họ giải quyết vấn đề của mình. Thiết kế UX là một vấn đề lớn ( và thậm chí có thể là lớn nhất ) trong các sản phẩm AI ngày nay.

Phải tập trung vào quy trình công việc toàn diện để giúp thu thập ngữ cảnh cần thiết từ người dùng để có lời nhắc tối ưu. Cũng phải có các quy trình làm việc trực quan để thu thập dữ liệu phản hồi nhằm tinh chỉnh các mô hình nhằm tiếp tục xây dựng một con hào.

Có một khoảng cách lớn giữa khoảnh khắc “ồ” của một mô hình tổng quát và việc khiến ai đó trở thành người dùng trả tiền — phần lớn khoảng cách này được lấp đầy bằng một trải nghiệm người dùng tuyệt vời. Jasper.ai là một ví dụ tuyệt vời về một công ty đã thực hiện điều này và hiện được đồn đại là sắp đạt ARR 80 triệu đô la, chỉ mới ra mắt vào năm ngoái.

Tận dụng kỹ thuật nhanh chóng

Hiện tại có một bức tranh trống khi xem xét cách chúng ta tương tác với AI, điều này đã dẫn đến việc chuyển trọng tâm sang Kỹ thuật nhanh hơn là các mô hình thống kê. Nói chung, điều này có nghĩa là thiết kế đầu vào của bạn thành một mô hình, tối ưu hóa để dễ dàng, chính xác và tiết kiệm chi phí . Một vài ví dụ là:

Zero-Shot — một lời nhắc bằng ngôn ngữ tự nhiên như thể bạn đang yêu cầu một đứa trẻ mới biết đi (đã đọc hầu hết toàn bộ Wikipedia) làm điều gì đó, ví dụ như đầu vào sẽ là “mô tả nhiệm vụ”:{văn bản đích}. Đây rõ ràng là cách đơn giản nhất để tương tác với AI.
Vài cảnh quay — thêm một vài ví dụ và một số ngữ cảnh vào đầu ra dự kiến (xem hình ảnh bên dưới). Điều này đòi hỏi nhiều “kỹ thuật” hơn nhưng có thể cải thiện rất nhiều về độ chính xác . Tuy nhiên, việc thêm ngữ cảnh vào mỗi lời nhắc có nghĩa là nó có thể tốn nhiều tiền hơn (thêm về điều này bên dưới).
Tinh chỉnh — lấy nhiều (hàng trăm hoặc hàng nghìn) ví dụ và đào tạo lại một mô hình đã được đào tạo trước để thay đổi các tham số sao cho bạn không cần đưa các ví dụ vào mỗi lời nhắc nữa. Quá trình này có thể rất tốn kém và có thể tiêu tốn hàng triệu đô la nhưng một khi nó được thực hiện, nó sẽ được thực hiện.

Nguồn: OpenAI — Language Models are Few-Shot Learners

Tập trung vào Use-case

AI đang trở thành một nền tảng, tương tự như Cloud hay Mobile. Có nhiều công ty đang tập trung vào việc xây dựng nền tảng đó và chắc chắn rằng họ sẽ thu được một lượng giá trị khổng lồ, bằng chứng là OpenAI đã được định giá 20 tỷ USD. Tuy nhiên, có một lý do khiến AWS không tập trung vào việc xây dựng các giải pháp SaaS theo chiều dọc — rất khó để tập trung vào cả việc xây dựng nền tảng và xây dựng các trường hợp sử dụng trên nền tảng đó, điều này được minh chứng thêm bởi các Ứng dụng tầm thường của Apple. Chúng tôi tin rằng có rất nhiều giá trị sẽ được mở khóa khi tập trung vào các trường hợp sử dụng và ứng dụng AI cụ thể, tương tự như cách mô hình kinh doanh Uber được mở khóa bằng điện thoại di động.

Tuy nhiên, trường hợp kinh doanh này phải được thực hiện với một nhúm muối. Có nhiều trường hợp sử dụng AI nằm trong nhóm “tính năng” hơn là một sản phẩm đầy đủ. PhotoRoom , công ty mà chúng tôi đã hợp tác gần đây, là một trong những công ty đầu tiên tận dụng tính năng Khuếch tán ổn định trong việc xây dựng một tính năng AI rất thiết thực và hiện đã đẩy nhanh tốc độ tăng trưởng. Nhiều tập đoàn lớn hơn, chẳng hạn như Notion và Microsoft , hiện đang tận dụng các mô hình có sẵn để nâng cao sản phẩm của họ, điều này càng chứng tỏ rằng chiến lược sở hữu giao diện người dùng và kỹ thuật nhanh chóng thay vì xây dựng các mô hình của riêng bạn dường như đang thắng thế.

Tôi cũng nên báo trước rằng trong một số trường hợp, việc sở hữu mô hình và xây dựng AI từ đầu có thể hợp lý. Một lĩnh vực đặc biệt thú vị là trong Decision Transformers và tận dụng kiến trúc mô hình đột phá để tạo ra các hành động thay vì chỉ nội dung. Adept.ai là một công ty tuyệt vời đang làm việc này. Tôi sẽ khám phá điều này hơn nữa trong một bài viết khác…

Hiểu mô hình kinh tế học

OpenAI tính phí 0,02 đô la cho mỗi 1000 mã thông báo (khoảng 750 từ) và con số này đã giảm từ 0,06 đô la vào mùa hè này. Khi sử dụng tính năng học vài lần, có tới 90% lời nhắc có thể là “ngữ cảnh”, nghĩa là chi phí có thể cao gấp ~10 lần so với phương pháp học không lần. Các doanh nghiệp thông minh có thể tạo lợi thế bằng cách tối ưu hóa tỷ lệ “ngữ cảnh” so với “văn bản đích” và thực hiện những việc thông minh như xóa bất kỳ từ nào khỏi “văn bản đích” mà không ảnh hưởng đến đầu ra.

Rõ ràng là các doanh nghiệp được xây dựng trên mô hình của bên thứ ba có khả năng gặp rủi ro về giá giống như cách các doanh nghiệp được xây dựng trên Đám mây gặp rủi ro về giá đối với các nhà cung cấp đám mây. Chúng tôi tin rằng AI sẽ tìm thấy sự cân bằng giống như Cloud có, trong đó giá trị tạo ra xứng đáng với việc trả tiền cho sự nhanh nhẹn và sức mạnh do các công ty bên thứ ba như OpenAI cung cấp. Nhiều doanh nghiệp AI giai đoạn đầu mà chúng tôi đã gặp có thể hoạt động với tỷ suất lợi nhuận gộp là 70–80% và chúng tôi cho rằng tỷ suất lợi nhuận này sẽ tăng lên khi họ có thể tăng đề xuất giá trị của mình trong tương lai.

Ngoài ra, điều đáng chú ý là phần lớn điện toán đám mây đã sẵn sàng cho các trường hợp sử dụng học sâu. Điều này báo hiệu rằng tình trạng định giá ổn định cho các nền tảng AI có thể ở cùng khu vực với điện toán đám mây ngày nay, điều mà hầu hết các doanh nghiệp có vẻ ổn với.

Có khả năng thực tế là sức mạnh tính toán bắt kịp với việc mở rộng mô hình để các mô hình hiện đại (hoặc ít nhất là gần như hiện đại) có thể chạy trên thiết bị — điều này có nghĩa là chi phí cận biên của AI có xu hướng bằng không. Stability.ai đã có thể chạy một số mô hình của họ trên thiết bị , điều này cuối cùng có thể đưa chi phí cận biên xuống 0 đối với một số tác vụ. Ngoài ra còn có ngày càng nhiều nền tảng AI ( Cohere , AI21 , v.v.), nhiều nền tảng trong số đó đang chọn mã nguồn mở cho các mô hình của họ. Điều đáng nói là có một số cách thông minh để giảm thiểu chi phí , chẳng hạn như chưng cất mô hình.

Điều này hạn chế khả năng định giá tổng thể của họ và họ có thể phải đưa ra các mô hình kinh doanh sáng tạo hơn, ngoài các lệnh gọi API, để kiếm tiền từ nghiên cứu của mình.

Phần kết luận

Nếu thị trường đủ lớn, chúng tôi tin rằng có tiềm năng rất lớn cho sự đột phá của các công ty khởi nghiệp bằng cách xây dựng các ứng dụng từ đầu, với cốt lõi là các mô hình có sẵn. Ví dụ: Gong và Otter là hai công ty tuyệt vời đã xây dựng các sản phẩm dựa trên các mô hình sao chép độc quyền.

Giờ đây, khi các mô hình sao chép tiên tiến nhất đã ra mắt và chi phí cho AI đang có xu hướng bằng 0, đó là một sân chơi bình đẳng. Điều này đã mở ra cơ hội lớn cho các công ty khởi nghiệp nắm bắt giá trị trong thị trường năng suất khổng lồ bằng cách sở hữu lớp UX và Kỹ thuật nhanh chóng. Nếu bạn là người sáng lập tận dụng AI, chúng tôi muốn nói chuyện với bạn — vui lòng liên hệ với tôi tại [email protected]