psi głos

Sztuczna Inteligencja zrozumie i przetłumaczy psi głos

Sztuczna inteligencja za pomocą algorytmów może dekodować psi głos z dokładnością do 70%, ujawniając ich emocje i intencje.

Czy kiedykolwiek marzyłeś o możliwości zrozumienia, co twój pies próbuje ci powiedzieć? Dzięki nowym badaniom z Uniwersytetu Michigan, jesteśmy o krok bliżej do realizacji tego marzenia. Naukowcy opracowali narzędzie sztucznej inteligencji (SI), które potrafi rozróżnić, czy szczekanie psa wyraża zabawę czy agresję. Co więcej, to samo narzędzie jest w stanie określić wiek, płeć i rasę psa na podstawie jego wokalizacji.

Jednym z kluczowych osiągnięć w tych badaniach było zastosowanie modeli SI pierwotnie stworzonych do analizy ludzkiej mowy. Dzięki temu naukowcy mogli uniknąć konieczności budowania modelu od podstaw. Zamiast tego, zaadaptowali istniejące modele, takie jak Wav2Vec2, które wcześniej były trenowane na danych ludzkiej mowy. Te modele są w stanie rozpoznawać niuanse w tonie, wysokości i akcentach, co pozwala komputerom na interpretację wypowiadanych słów oraz identyfikację mówców. Teraz te umiejętności zostały przeniesione na analizę psich szczeknięć.

Jednym z największych wyzwań w badaniach nad wokalizacjami zwierząt jest brak dostępnych danych. W przeciwieństwie do ludzkiej mowy, nagrywanie dźwięków zwierząt jest znacznie trudniejsze. Aby to przezwyciężyć, zespół badawczy skorzystał z nagrań wokalizacji 74 psów różnej rasy, wieku i płci, zebranych w różnych kontekstach. Dzięki współpracy z Meksykańskim Narodowym Instytutem Astrofizyki, Optyki i Elektroniki (INAOE), udało się zgromadzić wystarczająco dużo materiału do przeprowadzenia badań.

Wyniki były obiecujące. Model Wav2Vec2 nie tylko pomyślnie przeprowadził cztery zadania klasyfikacyjne, ale także przewyższył inne modele trenowane specjalnie na danych psich szczeknięć, osiągając dokładność do 70%. To pierwszy przypadek, kiedy techniki optymalizowane dla ludzkiej mowy zostały zastosowane do dekodowania komunikacji zwierząt.

Odkrycia te mają ważne implikacje nie tylko dla naukowców zajmujących się badaniami nad zwierzętami, ale również dla właścicieli psów i specjalistów zajmujących się zwierzętami w wielu branżach. Lepsze zrozumienie wokalizacji psów może znacznie poprawić sposób, w jaki interpretujemy i reagujemy na emocjonalne i fizyczne potrzeby naszych czworonożnych przyjaciół, co w efekcie może poprawić ich opiekę i zapobiegać potencjalnie niebezpiecznym sytuacjom.

Naukowcy są zgodni, że jesteśmy dopiero na początku drogi. Jak mówi Rada Mihalcea, dyrektor Laboratorium SI na Uniwersytecie Michigan, „Nasze badania otwierają nowe okno na to, jak możemy wykorzystać to, co zbudowaliśmy do tej pory w przetwarzaniu mowy, aby zacząć rozumieć niuanse szczekania psów.”

Możliwość dekodowania psich wokalizacji ma potencjał do szerokiego zastosowania. Może to być przydatne w badaniach nad zachowaniami zwierząt, w szkoleniu psów, a także w poprawie interakcji między ludźmi a ich zwierzętami domowymi. Wyobraź sobie aplikację na smartfona, która informuje cię, czy twój pies jest głodny, chce się bawić, czy czuje się zagrożony. Tego typu innowacje mogą znacznie poprawić jakość życia zarówno psów, jak i ich właścicieli.

Choć jesteśmy dopiero na początku tej drogi, potencjał technologii jest ogromny i może wpłynąć na naszą zdolność do komunikacji ze zwierzętami.

Szymon Ślubowski

SUBSKRYBUJ „GAZETĘ NA NIEDZIELĘ” Oferta ograniczona: subskrypcja bezpłatna do 31.08.2024.

Strona wykorzystuje pliki cookie w celach użytkowych oraz do monitorowania ruchu. Przeczytaj regulamin serwisu.

Zgadzam się