Sztuczna inteligencja rozpoznaje emocje twarzy prawie bezbłędnie
Nowa metoda oparta na sieci neuronowej skutecznie rozpoznaje emocje z twarzy z dokładnością 99% w czasie rzeczywistym.
Nowe badania wprowadziły metodę poprawy dokładności i szybkości rozpoznawania emocji na podstawie twarzy, wykorzystując konwolucyjną sieć neuronową (CNN) do analizy wyrazów twarzy. Prace, prowadzone przez Lanbo Xu z Northeastern University w Shenyang, Chiny, mogą znaleźć zastosowanie w obszarach takich jak zdrowie psychiczne, interakcje człowiek-komputer, bezpieczeństwo i inne. Zostały one opublikowane w czasopiśmie „International Journal of Biometrics”.
Ekspresje twarzy odgrywają kluczową rolę w komunikacji niewerbalnej, dostarczając wskazówek dotyczących stanu emocjonalnego osoby. Do tej pory systemy rozpoznawania emocji wykorzystywały statyczne obrazy, co ograniczało ich zdolność do uchwycenia zmieniających się emocji podczas rozmowy czy wywiadu. Prace Xu rozwiązały ten problem, koncentrując się na sekwencjach wideo. System ten śledzi zmiany w wyrazach twarzy na przestrzeni kilku klatek wideo, oferując szczegółową analizę emocji rozwijających się w czasie rzeczywistym.
Zanim jednak nastąpi analiza, system stosuje algorytm „chaotic frog leap”, który wyostrza kluczowe cechy twarzy. Algorytm ten naśladuje zachowania żab podczas poszukiwania optymalnych parametrów w obrazach cyfrowych. CNN, wytrenowana na zbiorze danych z ludzkimi ekspresjami, umożliwia systemowi rozpoznawanie wzorców w nowych obrazach, porównując je z danymi treningowymi. Analizując kilka klatek materiału wideo, system wychwytuje subtelne ruchy ust, oczu i brwi, które są kluczowymi wskaźnikami zmian emocji.
Według Xu system osiąga dokładność do 99% i dostarcza wyniki w ułamku sekundy. Taka precyzja i szybkość sprawiają, że jest to idealne rozwiązanie do zastosowania w czasie rzeczywistym w różnych dziedzinach, gdzie detekcja emocji może być przydatna bez konieczności subiektywnej oceny przez człowieka. Potencjalne zastosowania obejmują poprawę interakcji z komputerami, gdzie system mógłby reagować na stan emocjonalny użytkownika, taki jak frustracja, złość czy znudzenie.
System może być także użyteczny w procesie wstępnej diagnozy zaburzeń emocjonalnych bez interwencji człowieka. Może również znaleźć zastosowanie w systemach bezpieczeństwa, ograniczając dostęp do zasobów tylko dla osób w określonym stanie emocjonalnym, np. nie wpuszczając zdenerwowanej osoby. Kolejną możliwością jest wykorzystanie systemu do monitorowania zmęczenia kierowców, co mogłoby poprawić bezpieczeństwo na drogach. W branży rozrywkowej i marketingowej taki system mógłby pomóc w lepszym zrozumieniu reakcji emocjonalnych konsumentów, co mogłoby wpłynąć na rozwój i dostarczanie treści, a także zaangażowanie klientów.
Szymon Ślubowski