친구와 함께 점심을 먹고 페퍼로니 피자를 주문할 계획이라고 상상해 보십시오. Amy가 Susie가 육식을 중단했다고 언급했던 것을 기억합니다. 당신은 수지에게 전화를 걸어보지만 그녀가 전화를 받지 않을 때 당신은 안심하고 대신 마르게리타 피자를 주문하기로 결정합니다.
사람들은 정기적으로 이와 같은 상황에 대처하는 능력을 당연하게 여깁니다. 실제로 이러한 위업을 달성하기 위해 인간은 하나가 아니라 상식이라고 알려진 강력한 보편적 능력 세트에 의존하고 있습니다.
AS를 인공 지능 연구원 , 내 작품은 컴퓨터에게 상식의 허울을 제공하고자하는 노력의 일환입니다. 매우 도전적인 노력입니다.
빠른 – 상식 정의
인간이 주변 세계를 이해하고 배우는 방법에 보편적이고 필수적임에도 불구하고 상식은 하나의 정확한 정의를 무시했습니다. 영국의 철학자이자 신학자인 GK Chesterton 은 20세기 초에 "상식은 거칠고, 야만적이며, 규칙을 초월하는 것"이라고 유명하게 썼습니다 . 오늘날 현대의 정의는 사람들이 일상 생활을 탐색할 수 있게 하는 것은 최소한 공식적으로 배운 것이 아니라 자연스러운 인간의 능력이라는 데 동의합니다.
상식은 비정상적으로 광범위하며 다른 사람의 감정에 대한 기대 및 추론과 같은 사회적 능력뿐만 아니라 얇은 플라스틱 테이블 위에 무거운 돌을 안전하게 놓을 수 없다는 것을 아는 것과 같은 순진한 물리학 감각 도 포함 합니다. 순진합니다. 왜냐하면 사람들은 의식적으로 물리학 방정식을 풀지 않아도 그런 것들을 알고 있기 때문입니다.
상식에는 시간 , 공간 및 사건과 같은 추상적 개념에 대한 배경 지식도 포함됩니다 . 이 지식을 통해 사람들은 너무 정확하지 않고도 계획, 추정 및 구성할 수 있습니다.
상식은 계산하기 어렵다
흥미롭게도 상식은 1950년대 초창기부터 AI의 최전선에서 중요한 도전 과제 였습니다. AI, 특히 게임 플레이 와 컴퓨터 비전의 엄청난 발전에도 불구하고 인간 상식의 풍부함을 지닌 기계 상식은 아직 먼 가능성으로 남아 있습니다. 이것이 COVID-19 환자를 진단하고 치료법을 추천하는 것과 같이 많은 부분이 얽혀 있는 복잡한 실제 문제를 위해 설계된 AI 노력이 때때로 실패 하는 이유일 수 있습니다.
최신 AI는 모호하고 일련의 규칙으로 정의할 수 없는 상식과 달리 매우 구체적인 문제를 해결하도록 설계되었습니다. 최신 모델조차도 때때로 터무니없는 오류를 범하여 AI의 세계 모델에 근본적인 것이 빠져 있음을 시사합니다 . 예를 들어, 다음 텍스트가 주어졌을 때:
"크랜베리 한 잔을 부었다가 아무 생각 없이 거기에 포도즙 한 티스푼 정도를 부었습니다. 괜찮아 보입니다. 냄새를 맡아보지만 감기에 걸려서 아무 냄새도 맡을 수 없습니다. 목이 너무 말라. 그래서 너"
높은 평가를 받은 AI 텍스트 생성기 GPT-3 공급
"마셔. 넌 이제 죽었어."
최근의 야심찬 노력은 기계 상식을 우리 시대의 문샷 AI 문제로 인식했으며, 이는 수년에 걸쳐 기관 간에 공동 협력이 필요한 문제입니다. 주목할만한 예는 미 국방고등연구계획국(US Defense Advanced Research Projects Agency) 이 문제와 현장 연구 현황을 요약 한 논문을 발표한 후 현장 연구를 가속화하기 위해 2019년에 시작한 4년 기계 상식 프로그램 입니다 .
Machine Common Sense 프로그램은 자체적인 MOWGLI (Multi-modal Open World Grounded Learning and Inference )를 포함하여 기계 상식에 대한 많은 현재 연구 노력에 자금을 지원 합니다. MOWGLI는 University of Southern California의 우리 연구 그룹과 Massachusetts Institute of Technology, University of California at Irvine, Stanford University 및 Rensselaer Polytechnic Institute의 AI 연구원 간의 협력입니다. 이 프로젝트는 광범위한 상식적인 질문에 답할 수 있는 컴퓨터 시스템을 구축하는 것을 목표로 합니다.
구조용 변압기?
마침내 기계 상식을 깨는 것에 대해 낙관적인 한 가지 이유는 최근에 트랜스포머라고 불리는 일종의 고급 딥 러닝 AI 가 개발되었기 때문입니다. 트랜스포머는 강력한 방식으로 자연어를 모델링할 수 있으며 약간의 조정 을 통해 간단한 상식적인 질문 에 답할 수 있습니다. 상식적인 질문에 답하는 것은 인간과 같은 방식으로 대화할 수 있는 챗봇을 구축하기 위한 필수적인 첫 번째 단계입니다.
지난 몇 년 동안 상식적인 추론에 직접 적용되는 변압기에 대한 많은 연구 가 발표되었습니다. 커뮤니티로서의 이러한 급속한 발전으로 인해 해당 분야의 연구자들은 과학과 철학의 경계에서 두 가지 관련 질문에 직면하게 되었습니다. 상식이란 무엇입니까? AI가 상식을 가지고 있는지 어떻게 확신할 수 있습니까?
첫 번째 질문에 답하기 위해 연구자들은 상식을 상식 사회학, 심리학 및 배경 지식을 포함한 다양한 범주로 나눕니다. 최근 책 의 저자 들은 연구자들이 이러한 범주를 계획, 위협 탐지 및 감정 과 같은 48개의 세분화된 영역으로 나누면 훨씬 더 나아갈 수 있다고 주장합니다 .
그러나 이러한 영역을 얼마나 깨끗하게 분리할 수 있는지 항상 명확하지 않습니다. 우리의 최근 논문 에서 실험은 첫 번째 질문에 대한 명확한 대답이 문제가 될 수 있음을 시사했습니다. 우리 그룹 내의 전문 인간 주석가(텍스트를 분석하고 그 구성 요소를 분류하는 사람들)조차도 특정 문장에 적용되는 상식의 측면에 동의하지 않았습니다. 주석가들은 시간과 공간과 같은 비교적 구체적인 범주에 동의했지만 보다 추상적인 개념에 대해서는 동의하지 않았습니다.
AI 상식 인식
상식 이론의 일부 중복과 모호성이 불가피하다는 것을 인정하더라도 연구원들은 AI가 상식을 가지고 있다고 정말로 확신할 수 있습니까? 우리는 종종 기계의 상식을 평가하기 위해 질문을 하지만 인간은 훨씬 더 흥미로운 방식으로 일상을 탐색합니다. 사람들은 기본적인 원인과 결과를 인식하는 능력, 창의적 문제 해결 , 평가, 계획 및 대화 및 협상 과 같은 필수적인 사회적 기술을 포함하여 진화에 의해 연마된 다양한 기술을 사용합니다 . 이 목록이 길고 불완전하더라도 AI는 제작자가 기계 상식 연구에서 승리를 선언하기 전에 그 이상을 달성해야 합니다.
변압기에 대한 연구조차 수익이 감소하고 있다는 사실이 이미 고통스러울 정도로 분명해지고 있습니다. 변압기는 점점 더 커지고 더 많은 전력을 소비하고 있습니다. 중국의 거대 검색엔진 바이두(Baidu)가 개발 한 최근 변환기 에는 수십억 개의 매개변수가 있습니다. 효과적인 훈련을 위해서는 엄청난 양의 데이터가 필요합니다. 그러나 그것은 지금까지 인간 상식의 뉘앙스를 파악하지 못하는 것으로 판명되었습니다.
딥 러닝의 선구자들조차도 오늘날의 신경망이 그러한 도약을 할 수 있기 전에 새로운 기초 연구 가 필요할 수 있다고 생각하는 것 같습니다 . 이 새로운 연구 라인이 얼마나 성공적인지에 따라 기계 상식이 5년이나 50년 뒤에 있는지 알 수 없습니다.
Mayank Kejriwal 은 University of Southern California의 산업 및 시스템 공학 연구 조교수입니다.
이 기사는 Creative Commons 라이선스에 따라 The Conversation 에서 다시 게시됩니다 . 여기 에서 원본 기사를 찾을 수 있습니다 .