Các nhà nghiên cứu sử dụng AI để giải mã ngôn ngữ bí mật của tiếng chó sủa

Các nhà nghiên cứu đang sử dụng các mô hình AI được đào tạo về giọng nói của con người để giải mã ngôn ngữ bí mật của loài chó . Nghiên cứu này đến từ các nhà nghiên cứu tại Đại học Michigan, Viện Vật lý thiên văn quốc gia Mexico và Viện Quang học và Điện tử. Các kết quả đầy hứa hẹn được trình bày tuần trước tại một hội nghị quốc tế cho thấy các mô hình AI ngày nay có thể là chìa khóa để hiểu ngôn ngữ động vật, ít nhất là ở một mức độ nào đó.
Nội dung liên quan
Rada Mihalcea, giám đốc Phòng thí nghiệm AI của Đại học Michigan cho biết : “Có rất nhiều điều chúng ta chưa biết về các loài động vật cùng chia sẻ thế giới này với chúng ta”. “Những tiến bộ trong AI có thể được sử dụng để cách mạng hóa sự hiểu biết của chúng ta về giao tiếp ở động vật và những phát hiện của chúng tôi cho thấy rằng chúng ta có thể không phải bắt đầu lại từ đầu.”
Nội dung liên quan
- Tắt
- Tiếng Anh
Nghiên cứu sử dụng mô hình giọng nói AI tiên tiến, Wav2Vec2, để xác định cảm xúc, giới tính và giống chó đằng sau bất kỳ tiếng sủa nào. Các nhà nghiên cứu đã sử dụng hai bộ dữ liệu khác nhau để huấn luyện và so sánh kết quả: một bộ được huấn luyện từ đầu chỉ về tiếng chó sủa, và một bộ dữ liệu được huấn luyện trước về giọng nói của con người và sau đó tinh chỉnh về tiếng sủa. Mô hình được đào tạo trước về gần 1.000 giờ ghi âm giọng nói của con người đã hoạt động tốt hơn. Sau đó, các nhà nghiên cứu đã tinh chỉnh mô hình đó trên bộ dữ liệu bao gồm giọng nói (tiếng sủa) của 74 con chó: 42 con Chihuahua, 21 con Poodle Pháp và 11 con Schnauzer.
Mô hình AI được huấn luyện trên người và chó này có thể xác định cảm xúc của một con chó với độ chính xác 62%, giống với độ chính xác 62%, giới tính với độ chính xác 69% và xác định một con chó cụ thể trong đàn với độ chính xác 50%. Tất cả những điểm số này đều vượt xa mô hình AI vừa được huấn luyện trên chó, điều này cho thấy âm thanh và các mẫu bắt nguồn từ lời nói của con người có thể đóng vai trò là nền tảng để hiểu động vật.
Khi cố gắng giải mã cảm xúc đằng sau tiếng sủa của một con chó, các nhà nghiên cứu đưa ra giả thuyết rằng tiếng kêu của một con chó có liên quan đến bối cảnh của nó. Bằng chứng hiện tại cho thấy âm thanh mà khỉ và cầy thảo nguyên tạo ra có thể được dự đoán dựa trên bối cảnh tình huống mà chúng gặp phải. Một số cảm xúc mà các nhà nghiên cứu cố gắng gán cho chó trong nghiên cứu này là sủa hung hãn, sủa bình thường, kêu ré tiêu cực và những lời càu nhàu tiêu cực. Mặc dù chó có thể trải nghiệm nhiều cảm xúc hơn nhưng những tiếng động này phần lớn đã có sẵn trong tập dữ liệu của chúng.
Mihalcea cho biết: “Bằng cách sử dụng các mô hình xử lý giọng nói được đào tạo ban đầu về giọng nói của con người, nghiên cứu của chúng tôi mở ra một cánh cửa mới về cách chúng tôi có thể tận dụng những gì chúng tôi đã xây dựng cho đến nay trong xử lý giọng nói để bắt đầu hiểu các sắc thái của tiếng chó sủa”.
Trong tương lai, các nhà nghiên cứu cho biết họ muốn thử nghiệm nhiều giống, cảm xúc và loài hơn để hiểu mức độ của công nghệ này. Đây là lần đầu tiên mô hình giọng nói của con người được sử dụng để giải mã thông tin liên lạc của động vật và nó có thể đặt nền tảng cho việc hiểu ngôn ngữ của động vật. Mặc dù nghiên cứu này chắc chắn không giải mã được ý nghĩa của tất cả tiếng chó sủa nhưng các nhà nghiên cứu coi đây là một bước đi đầy hứa hẹn theo hướng đó.