AI 에이전트는 현실과 공상 과학 사이의 점을 연결하겠다고 약속합니다

May 27 2024
Google, Microsoft, OpenAI는 AI 에이전트가 어떻게 미래를 혁신할 것인지에 대해 이야기하고 있습니다.

이번 달 Google I/O , OpenAI의 Spring 업데이트 또는 Microsoft Build를 시청하셨다면 아마도 지난 달에 AI 에이전트라는 용어가 꽤 많이 등장했다는 것을 들어보셨을 것입니다. 그들은 기술 분야에서 빠르게 차세대 기술로 자리잡고 있습니다. 그런데 정확히 무엇입니까? 그런데 왜 갑자기 다들 그 얘기를 하는 걸까요?

관련된 컨텐츠

사람들은 유혹적인 GPT-4 Omni와 사랑에 빠지게 될 것입니다.
연준은 ChatGPT의 환각 문제를 조사하고 있습니다

Google CEO Sundar Pichai는 Google I/O 무대에 있는 동안 사용자 를 대신하여 신발 한 켤레를 돌려 줄 수 있는 인공 지능 시스템을 설명했습니다 . Microsoft에서는 독립적으로 가상 직원처럼 행동할 수 있는 Copilot AI 시스템을 발표했습니다. 한편, 오픈AI는 보고 듣고 말할 수 있는 AI 시스템인 GPT-4 옴니(Omni)를 공개했다. 이에 앞서 OpenAI CEO인 Sam Altman은 MIT Technology에 유용한 에이전트가 기술의 최고의 잠재력을 보유하고 있다고 말했습니다 . 이러한 유형의 시스템은 모든 AI 회사가 달성하려고 하는 새로운 벤치마크이지만 말처럼 쉽지는 않습니다.

관련된 컨텐츠

사람들은 유혹적인 GPT-4 Omni와 사랑에 빠지게 될 것입니다.
연준은 ChatGPT의 환각 문제를 조사하고 있습니다
왜 모두가 AI 회사를 고소하는가? | 미래기술
공유하다
자막
  • 끄다
  • 영어
이 영상을 공유해
페이스 북 트위터 이메일
레딧 링크
왜 모두가 AI 회사를 고소하는가? | 미래기술

간단히 말해서, AI 에이전트는 독립적으로 작업을 수행하는 AI 모델일 뿐입니다. Iron Man 의 Jarvis, Interstaller 의 Tars 또는 A Space Odyssey 의 HAL 9000 과 같습니다 . 그들은 우리에게 친숙해진 챗봇과 같은 응답을 생성하는 것보다 한 단계 더 나아갑니다. 바로 액션이 있습니다. 우선 Google, Microsoft, OpenAI는 디지털 작업을 처리할 수 있는 에이전트를 개발하려고 노력하고 있습니다. 이는 AI 에이전트가 컴퓨터에서 다양한 API를 사용하도록 가르치고 있음을 의미합니다. 이상적으로는 버튼을 누르고, 결정을 내리고, 채널을 자율적으로 모니터링하고, 요청을 보낼 수 있습니다.

Echo AI 창립자이자 CEO인 Alexander Kvamme는 “미래는 에이전트라는 점에 동의합니다.”라고 말했습니다. 그의 회사는 고객과의 비즈니스 대화를 분석하고 해당 경험을 개선하는 방법에 대한 통찰력을 제공하는 AI 에이전트를 구축합니다. “업계에서는 수년간 이에 대해 이야기해 왔지만 아직 실현되지 않았습니다. 정말 어려운 문제네요.”

Kvamme는 진정한 에이전트 시스템은 수십 또는 수백 가지 결정을 독립적으로 내려야 하며 이는 자동화하기 어려운 일이라고 말합니다. 예를 들어, Google의 Pichai가 설명했듯이 신발 한 켤레를 반품하려면 AI 에이전트가 귀하의 이메일을 스캔하여 영수증을 찾고, 주문 번호와 주소를 가져오고, 반품 양식을 작성하고, 귀하를 대신하여 다양한 작업을 수행해야 할 수 있습니다. 그 과정에서 당신이 생각조차 하지 못하는 많은 결정들이 있지만, 당신은 무의식적으로 내리고 있습니다.

지금까지 살펴본 것처럼 LLM(대형 언어 모델)은 통제된 환경에서도 완벽하지 않습니다. Altman이 가장 좋아하는 점은 ChatGPT를 "믿을 수 없을 정도로 멍청하다"고 부르는 것인데, 그의 말이 완전히 틀린 것은 아닙니다. LLM에게 개방형 인터넷에서 독립적으로 작업하도록 요청하면 실수하기 쉽습니다. 하지만 이는 Google, OpenAI, Microsoft와 같은 대기업뿐만 아니라 Echo AI를 포함한 수많은 스타트업이 작업하고 있는 작업입니다.

에이전트를 디지털 방식으로 만들 수 있다면 실제 세계에서도 작동하는 에이전트를 만드는 데 큰 장벽이 없습니다. 해당 작업을 로봇에 프로그래밍하면 됩니다. 그런 다음 AI 에이전트가 로봇에게 "테이블의 주문 받기" 또는 "이 지붕에 지붕 널 모두 설치"와 같은 작업을 할당할 수 있는 가능성을 제공하므로 공상 과학 소설의 내용에 실제로 빠져들게 됩니다. 아직 멀었지만 첫 번째 단계는 AI 에이전트에게 간단한 디지털 작업을 수행하도록 가르치는 것입니다.

AI 에이전트 세계에는 자주 언급되는 문제가 있습니다. 즉, 작업을 너무 잘 수행하도록 에이전트를 설계하지 않는지 확인하는 것입니다. 신발을 반품하는 에이전트를 구축한 경우 에이전트가 모든 신발을 반환하지 않도록 해야 하며 Gmail 받은 편지함에 영수증이 있는 모든 항목을 반환해야 할 수도 있습니다. 어리석게 들리겠지만, 지나치게 단호한 AI 에이전트가 인류 문명에 파멸을 초래할 수 있다고 걱정하는 AI 연구자 집단이 적지만 시끄럽습니다. 공상 과학 소설을 만들 때 그것은 타당한 우려 사항이라고 생각합니다.

스펙트럼의 반대편에는 이 기술이 힘을 실어줄 것이라고 믿는 Echo AI와 같은 낙관론자들이 있습니다. AI 커뮤니티의 이러한 차이는 매우 극명하지만 낙관론자들은 개인용 컴퓨터에 필적하는 AI 에이전트의 해방 효과를 봅니다.

Kvemme는 “저는 [에이전트]가 해결하게 될 많은 작업이 인간이 선호하지 않는 작업이라고 믿습니다.”라고 말했습니다. “그리고 그들의 삶에서 시간을 더 가치있게 사용하는 것이 있습니다. 하지만 이번에도 적응해야 합니다.”

AI 에이전트의 또 다른 사용 사례는 자율주행차입니다. Tesla와 Waymo는 현재 자동차가 AI 기술을 사용하여 도시의 거리와 고속도로를 탐색하는 이 기술의 선두 주자입니다. 틈새시장이긴 하지만, 자율주행 기술은 상당히 발전된 AI 에이전트 분야로, 우리는 이미 현실 세계에서 AI가 작동하는 모습을 보고 있습니다.

그렇다면 AI가 신발을 돌려줄 수 있는 미래로 우리를 데려가는 것은 무엇일까요? 첫째, 기본 AI 모델은 더욱 향상되고 정확해져야 합니다. 이는 ChatGPT, Gemini 및 Copilot에 대한 업데이트가 완전히 작동하는 에이전트 시스템보다 먼저 이루어질 것임을 의미합니다. AI 챗봇은 여전히 ​​거대한 환각 문제를 극복해야 하며 , 많은 연구자들은 이 문제를 해결할 답을 찾지 못하고 있습니다. 그러나 에이전트 시스템 자체에 대한 업데이트도 필요합니다. 현재 OpenAI의 GPT 스토어는 에이전트 네트워크를 개발하기 위한 가장 노력적인 노력이지만, 그것조차도 아직은 그다지 발전하지 않았습니다.

고급 AI 에이전트는 아직 확실히 존재하지 않지만 오늘날 많은 크고 작은 AI 회사의 목표입니다. 이것이 AI를 일상 생활에서 훨씬 더 유용하게 만드는 것일 수 있습니다. 공상과학 소설처럼 들리지만 에이전트를 현실로 만드는 데 수십억 달러가 소비됩니다. 그러나 기본적인 질문에 안정적으로 답변할 수 있는 챗봇을 확보하는 데 어려움을 겪어온 AI 기업에게는 어려운 약속입니다.