研究者がAIを使って犬の鳴き声の秘密の言語を解読

研究者たちは、人間の話し方で訓練されたAIモデルを使って、犬の 秘密の言語を解読している。この研究は、ミシガン大学、メキシコ国立天体物理学研究所、光学電子研究所の研究者によるものだ。先週の国際会議で発表されたこの有望な結果は、今日のAIモデルが、少なくともある程度は動物の言語を理解する鍵となり得ることを示している。
関連性のあるコンテンツ
「人間と同じ世界で暮らす動物について、まだ分かっていないことがたくさんある」とミシガン大学AI研究所所長のラダ・ミハルセア氏はプレスリリースで述べた。「AIの進歩は動物のコミュニケーションに対する理解を根本的に変える可能性があり、私たちの研究結果は、ゼロから始める必要はないかもしれないことを示唆している」
関連性のあるコンテンツ
- オフ
- 英語
この研究では、最先端の AI 音声モデル Wav2Vec2 を使用して、犬の鳴き声の背後にある感情、性別、犬種を識別します。研究者はトレーニングに 2 つの異なるデータ セットを使用し、結果を比較しました。1 つは犬の鳴き声のみで最初からトレーニングしたもので、もう 1 つは人間の発声で事前トレーニングした後、鳴き声で微調整したものです。約 1,000 時間の人間の発声録音で事前トレーニングしたモデルの方が、優れた結果が出ました。研究者はその後、そのモデルを 74 匹の犬の発声 (鳴き声) で構成されたデータ セットで微調整しました。内訳は、チワワ 42 匹、フレンチ プードル 21 匹、シュナウザー 11 匹です。
人間と犬を対象にトレーニングされたこの AI モデルは、犬の感情を 62%、犬種を 62%、性別を 69% の精度で識別し、群れの中から特定の犬を 50% の精度で識別することができました。これらのスコアはすべて、犬を対象にトレーニングされた AI モデルを上回っており、人間の発話から得られる音とパターンが動物を理解するための基礎として役立つ可能性があることを示唆しています。
犬の吠え声の背後にある感情を解明しようとして、研究者たちは犬の発声は状況に関係しているという仮説を立てました。既存の証拠は、サルやプレーリードッグが出す音は、彼らが置かれている状況の文脈に基づいて予測できることを示唆しています。この研究で研究者が犬に割り当てようとしている感情には、攻撃的な吠え声、通常の吠え声、否定的なキーキー音、否定的なうなり声などがあります。犬はおそらくはるかに多くの感情を経験しますが、これらの音は彼らのデータセットで主に利用可能でした。
「当初は人間の音声で訓練された音声処理モデルを使用することで、私たちの研究は、音声処理でこれまで構築してきたものを活用して犬の鳴き声のニュアンスを理解し始める方法についての新たな窓を開きます」とミハルセア氏は語った。
研究者たちは、今後、より多くの品種、感情、種をテストして、この技術の範囲を理解したいと述べている。人間の発話モデルが動物のコミュニケーションを解読するために使用されたのはこれが初めてであり、動物の言語を理解するための基礎を築く可能性がある。この研究は、すべての犬の鳴き声の意味を解明する決定的なものではないが、研究者たちはそれをその方向への有望な一歩と見ている。