AIエージェントは現実とSFの点を結びつける可能性を秘めている

May 27 2024
Google、Microsoft、OpenAI はいずれも、AI エージェントが将来にどのような革命を起こすかについて語っています。

今月の Google I/O OpenAI の Spring Update 、またはMicrosoft Build をご覧になった方は、おそらくこの 1 か月間に AI エージェントという言葉が頻繁に登場したのを耳にしたことでしょう。AI エージェントは急速にテクノロジーの次の大きなトレンドになりつつありますが、いったい何なのでしょうか。そして、なぜ突然、誰もが AI エージェントについて話しているのでしょうか。

関連性のあるコンテンツ

人々は魅力的なGPT-4 Omniに夢中になるでしょう
連邦政府はChatGPTの幻覚問題を調査中

Google CEO のサンダー・ピチャイ氏は、 Google I/O のステージ上で、ユーザーに代わって靴を返品できる人工知能システムについて説明しました。Microsoft では、仮想従業員のように独立して行動できる Copilot AI システムを発表しました。一方、OpenAI は、見たり聞いたり話したりできる AI システム GPT-4 Omni を公開しました。これに先立ち、OpenAI CEO のサム・アルトマン氏は、MIT Technology に対し、役に立つエージェントこそがテクノロジーの最大の潜在能力を持っていると語りました。こうしたタイプのシステムは、すべての AI 企業が達成しようとしている新しいベンチマークですが、言うのは簡単ですが、実行するのは難しいものです。

関連性のあるコンテンツ

人々は魅力的なGPT-4 Omniに夢中になるでしょう
連邦政府はChatGPTの幻覚問題を調査中
なぜ誰もが AI 企業を訴えるのか? | Future Tech
共有
字幕
  • オフ
  • 英語
この動画を共有します
Facebook Twitterメール
Redditリンク
なぜ誰もが AI 企業を訴えるのか? | Future Tech

簡単に言えば、AI エージェントとは、自律的に何かを行う AI モデルです。アイアンマンのジャービス、インターストラーのターズ、宇宙の旅の HAL 9000のようなものです。私たちが慣れ親しんでいるチャットボットのように応答を作成するだけでなく、さらに一歩進んでアクションを実行します。まず、Google、Microsoft、OpenAI は、デジタル アクションを処理できるエージェントの開発に取り組んでいます。つまり、AI エージェントにコンピューター上のさまざまな API を操作するように教えているのです。理想的には、ボタンを押したり、決定を下したり、チャネルを自律的に監視したり、リクエストを送信したりできるようになります。

「未来はエージェントにあるという意見に賛成です」と、Echo AI の創業者兼 CEO の Alexander Kvamme 氏は言う。同氏は、企業と顧客の会話を分析し、その体験を改善する方法についての洞察を提供する AI エージェントを開発している。「業界では何年も前からこの話題が取り上げられていますが、まだ実現していません。非常に難しい問題なのです」

Kvamme says a truly agentic system needs to make dozens or hundreds of decisions independently, which is a hard thing to automate. To return a pair of shoes for example, as Google’s Pichai explained, an AI agent may have to scan your email to look for a receipt, pull your order number and address, fill out a return form, and fulfill various actions on your behalf. There are many decisions in that process you don’t even think about, but you’re subconsciously making.

As we’ve seen, large language models (LLMs) are not perfect even in controlled environments. Altman’s new favorite thing is calling ChatGPT “incredibly dumb,” and he’s not exactly wrong. When you’re asking LLMs to work independently out on the open internet, they’re prone to mistakes. But that’s what countless startups, including Echo AI, are working on, as well as larger companies like Google, OpenAI, and Microsoft.

If you can create agents digitally, there’s not much of a barrier to creating agents that work with the physical world as well. You just have to program that task to a robot. Then you really get into the stuff of science fiction, as AI agents offer the potential to assign robots a task like “take that table’s order” or “install all the shingles on this roof.” We’re a long way from there, but the first step is teaching AI agents to do simple digital tasks.

There’s an often talked about problem in the world of AI agents: making sure you don’t design an agent to do a task too well. If you built an agent to return shoes, you’d have to make sure it doesn’t return all your shoes, or perhaps all the things you have receipts for in your Gmail inbox. Though it sounds silly, there’s a small but loud cohort of AI researchers who worry overly determined AI agents could spell doom for human civilization. I suppose when you’re building the stuff of science fiction, that’s a valid concern.

On the other side of the spectrum are optimists, like Echo AI, who believe this technology will be empowering. This divergence in the AI community is quite stark, but the optimists see a liberating effect with AI agents that’s comparable to the personal computer.

“I’m a big believer that a lot of the work that [agents] are going to solve is work that humans would prefer not to do,” Kvemme said. “And there’s higher value use for their time in their life. But again, they have to adapt.”

Another use case of AI agents is self-driving cars. Tesla and Waymo are currently the front runners in this technology, where cars use AI technology to navigate city streets and highways. Though it’s niche, self-driving technology is a fairly developed area of AI agents, where we’re already seeing AI operating in the real world.

では、AI が靴を返品できる未来に私たちはどうやってたどり着くのでしょうか。まず、基盤となる AI モデルは、より良く、より正確になる必要があるでしょう。つまり、ChatGPT、Gemini、Copilot のアップデートが、完全に機能するエージェント システムに先行することになります。AI チャットボットは、多くの研究者が解決の答えを見出せない大きな幻覚問題 をまだ克服する必要があります。しかし、エージェント システム自体のアップデートも必要です。現在、OpenAI の GPT ストアは、エージェント ネットワークを開発するための最も洗練された取り組みですが、それでもまだあまり進んでいません。

高度な AI エージェントはまだ実現していないことは確かですが、それが現在多くの大規模および小規模の AI 企業の目標となっています。それが AI を日常生活でより便利にするかもしれません。SF のように聞こえますが、私たちが生きている間にエージェントを現実のものにするために何十億ドルも費やされています。しかし、基本的な質問に確実に答えるチャットボットの開発に苦労してきた AI 企業にとっては、それは大きな夢です。