연구원들은 AI를 사용하여 개가 짖는 비밀 언어를 해독합니다.
연구원들은 개의 비밀 언어를 해독하기 위해 인간의 언어로 훈련된 AI 모델을 사용하고 있습니다 . 이 연구는 미시간 대학교, 멕시코 국립 천체물리학 연구소, 광학 및 전자 연구소의 연구원들이 진행한 것입니다. 지난 주 국제 회의에서 발표된 유망한 결과는 오늘날의 AI 모델이 적어도 어느 정도 동물 언어를 이해하는 데 핵심이 될 수 있음을 보여줍니다.
관련된 컨텐츠
미시간 대학 AI 연구소 소장인 라다 미할체아(Rada Mihalcea)는 보도 자료 에서 “우리는 이 세상을 우리와 공유하는 동물에 대해 아직 모르는 것이 너무 많다”고 말했습니다 . “AI의 발전은 동물 의사소통에 대한 우리의 이해를 혁신하는 데 사용될 수 있으며, 우리의 연구 결과는 우리가 처음부터 시작할 필요가 없을 수도 있음을 시사합니다.”
관련된 컨텐츠
- 끄다
- 영어
이 연구는 최첨단 AI 음성 모델인 Wav2Vec2를 활용하여 특정 짖는 소리 뒤에 있는 개의 감정, 성별 및 품종을 식별합니다. 연구원들은 훈련을 위해 두 개의 서로 다른 데이터 세트를 사용하고 결과를 비교했습니다. 하나는 처음부터 개 짖는 소리에 대해 훈련되었고, 다른 하나는 인간의 말에 대해 사전 훈련된 다음 짖는 소리에 대해 미세 조정되었습니다. 거의 1,000시간에 달하는 인간 음성 녹음을 바탕으로 사전 훈련된 모델이 더 나은 결과를 보였습니다. 그런 다음 연구원들은 74마리의 개(치와와 42마리, 프렌치 푸들 21마리, 슈나우저 11마리)의 발성(짖음)으로 구성된 데이터 세트를 기반으로 해당 모델을 미세 조정했습니다.
인간과 개를 대상으로 훈련된 이 AI 모델은 개의 감정을 62%의 정확도로 식별하고, 번식은 62%의 정확도, 성별은 69%의 정확도로 식별하고, 무리 중에서 특정 개를 50%의 정확도로 식별할 수 있었습니다. 이 모든 점수는 개를 대상으로 훈련한 AI 모델을 능가했으며, 이는 인간의 말에서 파생된 소리와 패턴이 잠재적으로 동물을 이해하는 기초가 될 수 있음을 시사합니다.
개 짖는 소리 뒤에 숨은 감정을 풀기 위해 연구자들은 개의 발성이 그 상황과 관련이 있다는 가설을 세웠습니다. 기존 증거에 따르면 원숭이와 프레리도그가 내는 소리는 그들이 처한 상황의 맥락에 따라 예측할 수 있습니다. 이 연구에서 연구자들이 개에게 지정하려고 하는 감정 중 일부는 공격적인 짖는 소리, 정상적인 짖는 소리, 부정적인 비명소리, 그리고 부정적인 투덜거림. 개는 훨씬 더 많은 감정을 경험할 가능성이 높지만 이러한 소음은 데이터 세트에서 주로 사용 가능합니다.
Mihalcea는 “처음에 인간의 말에 대해 훈련된 음성 처리 모델을 사용함으로써 우리의 연구는 지금까지 음성 처리에 구축한 기술을 활용하여 개 짖는 소리의 뉘앙스를 이해하는 방법에 대한 새로운 창을 열었습니다.”라고 말했습니다.
앞으로 연구원들은 이 기술의 범위를 이해하기 위해 더 많은 품종, 감정 및 종을 테스트하고 싶다고 말합니다. 인간의 음성 모델이 동물의 의사소통을 해독하는 데 사용된 것은 이번이 처음이며, 동물의 언어를 이해하기 위한 토대를 마련할 수 있을 것입니다. 이 연구가 모든 개 짖는 소리의 의미를 밝히는 데 확실히 결정적인 것은 아니지만 연구자들은 이를 그러한 방향으로 나아가는 유망한 단계로 보고 있습니다.