UX が AI の未来の戦場である理由
この分野に不慣れな方のために説明すると、私たちはクラウド コンピューティング以来最大の技術的変化の 1 つを経験しています。多くの優れた要約と市場マップが公開されているため、この変化にあまり時間をかけませんが、何が起こっているかを要約するために私が作成したスライドを次に示します.
最近の AI を活用したアプリケーションのカンブリア紀の爆発を調査するときによく出てくる質問の 1 つは、防御可能性です。これは、AI モデルがコモディティ化していることを投資家や創業者が十分に認識しているため、AI アプリケーションにおけるニューラル ネットワークの価値が急速に低下しているためです。
これらのモデルは、 OpenAIやStability.aiなどの企業によって公開されています。GPT-3 (OpenAI がホストするモデル) をまだ試したことがない場合は、試してみることを強くお勧めします。そうすれば、既製のモデルのほとんど魔法のようなパワーを理解できます。独自のモデルを構築したいと思っていたとしても、AI 研究がバランスシートの強さの関数になりつつある現在、ますます困難になっていることは注目に値します。
NLP は過去 10 年間で大幅に進歩しました。LSTM ネットワークは、シーケンスのさまざまな部分を選択的に記憶または忘れる能力により、RNN のパフォーマンスを大幅に向上させました。トランスフォーマーと「注意メカニズム」(スケーリングの法則と一緒に)は、これらのモデルが言語を本当に理解し始めたため、可能なことを段階的に変化させました。現在、拡散モデルは、あらゆる形式のコンテンツを生成する方法を再形成しています。以前は、ディープ ラーニングのブレークスルーが競争上の優位性を構築するために使用されていましたが、文化的および技術的な変化がありました ( Hugging Faceが大きな役割を果たしました)。開発者は、数行のコードで最先端の AI を製品に組み込むことができるようになりました。
しかし、全員が同じモデルを使用している場合、どうすれば競争上の優位性を構築できるでしょうか?
UXを所有する
私たちは、これらの大きなモデルの潜在空間に隠された力を理解し始めたばかりです. これらのモデルに提供できるコンテキストが多いほど、モデルはより優れたものになり、以前は膨大な量の堅牢なエンジニアリングが必要だったタスクがすぐに得意になります。尋ねるべき質問の 1 つは、「これらの強力なモデルへの唯一のインターフェイスは、単純で静的なテキスト ボックスだけになるのでしょうか? 」。
ほとんどの消費者は AI をまったく認識していないため、モデルの前に置くだけで問題の解決に役立つことはほとんどありません。UX デザインは、今日の AI 製品における大きな (そしておそらく最大の) 問題です。
最適なプロンプトのためにユーザーから必要なコンテキストを収集するのに役立つ包括的なワークフローに焦点を当てる必要があります。また、堀をさらに構築するためにモデルを微調整するためのフィードバック データを収集するための直感的なワークフローも必要です。
ジェネレーティブ モデルの「すごい」瞬間と、有料ユーザーになるまでの間には大きなギャップがあります。このギャップの大部分は、優れた UX によって埋められます。Jasper.ai はこれを実行した企業の好例であり、昨年ローンチしたばかりで、ARR が 8,000 万ドルに近づいていると噂されています。
迅速なエンジニアリングの活用
私たちが AI とどのようにやり取りするかを見ると、空白のキャンバスがあり、統計モデルではなくプロンプト エンジニアリングに焦点が移っています。これは広義には、モデルへの入力をエンジニアリングし、使いやすさ、精度、コストを最適化することを意味します。いくつかの例を次に示します。
- Zero-Shot — 幼児 (ウィキペディアの大部分を読んでいる) に何かをするように頼んでいるかのような自然言語プロンプト。たとえば、入力は「タスクの説明」:{ターゲット テキスト} になります。これは明らかに、AI と対話する最も簡単な方法です。
- Few-Shot — 予想される出力にいくつかの例とコンテキストを追加します (下の画像を参照)。これにはより多くの「エンジニアリング」が必要ですが、精度が大幅に向上する可能性があります。ただし、各プロンプトにコンテキストを追加すると、さらに多くのコストがかかる可能性があります (これについては以下で詳しく説明します)。
- 微調整 —多数 (数百または数千) のサンプルを取得し、事前トレーニング済みのモデルを再トレーニングしてパラメーターを変更し、各プロンプトにサンプルを含める必要がなくなるようにします。このプロセスは非常に高くつく可能性があり、何百万ドルもかかる可能性がありますが、完了したら完了です。
ユースケースに注目
AI は、クラウドやモバイルと同様にプラットフォームになりつつあります。そのプラットフォームの構築に注力している企業は数多くあり、OpenAI の評価額が 200 億ドルであることからも明らかなように、彼らが莫大な価値を獲得することは間違いありません。ただし、AWS が垂直型 SaaS ソリューションの構築に重点を置いていないのには理由があります。プラットフォームの構築とそのプラットフォームでのユースケースの構築の両方に集中することは非常に困難であり、Apple の平凡なアプリによってさらに証明されています。Uber のビジネス モデルがモバイルによって解き放たれたのと同様に、特定の AI ユースケースとアプリケーションに焦点を当てることで、解き放たれる莫大な価値があると私たちは信じています。
ただし、このビジネス ケースには、少し塩を足す必要があります。完全な製品ではなく、「機能」バケット内に収まる AI のユースケースが多数あります。最近提携したPhotoRoomは、Stable Diffusion を活用して非常に実用的な AI 機能を構築した最初の企業の 1 つであり、現在では成長を加速させています。NotionやMicrosoftなどの大企業の多くは、製品の機能強化のために既製のモデルを活用しています。これは、独自のモデルを構築するのではなく、UI を所有し、エンジニアリングを迅速に行うという戦略が勝っているように見えることをさらに証明しています。
また、状況によっては、モデルを所有してゼロから AI を構築することが理にかなっている場合があることにも注意してください。特にエキサイティングな分野の 1 つは意思決定トランスフォーマーであり、画期的なモデル アーキテクチャを活用して単なるコンテンツではなくアクションを生成します。Adept.aiはまさにこれを行っている素晴らしい会社です。これについては、別の投稿で詳しく説明します…
モデルノミクスを理解する
OpenAIは 1000 トークン(約 750 ワード) あたり 0.02 ドルを請求し、この夏の 0.06 ドルから値下げされました。少数ショット学習を使用する場合、プロンプトの最大 90% を「コンテキスト」にすることができます。つまり、コストはゼロショットの約 10 倍になる可能性があります。賢明なビジネスは、「文脈」と「ターゲット テキスト」の比率を最適化し、出力に影響しない単語を「ターゲット テキスト」から削除するなどの賢明なことを行うことで、優位性を築くことができます。
サード パーティ モデルに基づいて構築されたビジネスは、クラウド上に構築されたビジネスがクラウド プロバイダーに対して価格リスクにさらされるのと同じように、価格リスクにさらされる可能性があることは明らかです。OpenAI などのサードパーティ企業が提供する俊敏性とパワーに対価を支払うことを正当化する価値が生み出されるという点で、AI はクラウドと同じバランスを見つけると私たちは信じています。私たちが出会った多くの初期段階の AI ビジネスは、70 ~ 80% の粗利益で運営できており、今後価値提案を高めることができるため、これは増加すると考えています。
さらに、クラウド コンピューティングの大部分がすでにディープ ラーニングのユースケース用であることも注目に値します。これは、AI プラットフォームの価格設定の安定した状態が、今日のクラウド コンピューティングと同じ地域にある可能性があることを示しており、ほとんどの企業はこれで問題ないと思われます。
コンピューティング能力がモデルの拡張に追いつく現実的な可能性があり、最先端の (または少なくとも最先端に近い) モデルをデバイス上で実行できます。これは、AI の限界費用がゼロになる傾向があることを意味します。Stability.ai はすでに一部のモデルをデバイス上で実行できるようになっているため、最終的に一部のタスクの限界費用がゼロになる可能性があります。また、AI プラットフォーム ( Cohere、AI21など)の数も増えており、その多くはモデルをオープンソース化することを選択しています。また、モデルの蒸留など、コストを最小限に抑える賢い方法がいくつかあることにも言及する価値があります。
これにより、全体的な価格設定力が制限され、研究を収益化するために、API 呼び出しに加えて、より創造的なビジネス モデルを考え出す必要がある場合があります。
結論
市場が十分に大きい場合、既製のモデルを中心にアプリケーションをゼロから構築することで、スタートアップを混乱させる大きな可能性があると考えています。たとえば、GongとOtterは、独自の文字起こしモデルの上に製品を構築した 2 つの偉大な企業です。
最先端のトランスクリプション モデルが公開され、 AI のコストがゼロになりつつある現在、それは平等な競争の場です。これにより、新興企業が UX およびプロンプト エンジニアリング層を所有することで、大規模な生産性市場で価値を獲得する大きな機会が開かれました。もしあなたが AI を活用している創業者であるなら、ぜひお話したいと思います — [email protected]までお気軽にご連絡ください。