Kirigami

Technologia Kirigami chroni użytkownika przed podsłuchem

Kirigami filtruje ludzką mowę w czasie rzeczywistym z nagrań audio przed opuszczeniem dźwięku przez urządzenie.

W świecie, w którym smartfony, inteligentne głośniki i inne urządzenia z mikrofonami stają się codziennością, kwestia prywatności dźwięku nabiera wyjątkowej wagi. Dźwięk, choć pozornie niewinny, niesie ze sobą mnóstwo informacji. Od zwykłych domowych odgłosów, przez dźwięki otoczenia, po rozmowy, które zdradzają więcej, niż użytkownik byłby gotów przyznać. Odpowiedzią na wyzwania może być Kirigami, która jest technologią opracowaną przez naukowców z Carnegie Mellon University, która filtruje ludzką mowę z nagrań audio jeszcze zanim opuści ono urządzenie.

Wiele obecnych urządzeń nasłuchujących działa bezrefleksyjnie – rejestrują wszystko, co usłyszą, a dane są przetwarzane w chmurze. Choć dostarczają wygody, mogą też podsłuchiwać prywatne rozmowy, nieświadomie stając się narzędziem naruszenia prywatności. Przykładem były m.in. kontrowersje wokół asystentów głosowych Amazona czy Google, których dane głosowe trafiały do pracowników firm celem „poprawy jakości usług”.

W tym kontekście Kirigami jest przełomem. Działa lokalnie, na tzw. „krawędzi” (edge computing), rozpoznaje ludzką mowę i usuwa ją z nagrania, zanim zostanie ono przetworzone lub przesłane. Co istotne, system zaprojektowano tak, by działał nawet na prostych i tanich mikrokontrolerach, co oznacza, że może być łatwo wdrożony w milionach urządzeń Internetu Rzeczy (IoT).

Do tej pory najczęściej stosowane były techniki zamazywania dźwięku, czyli usuwania konkretnych częstotliwości albo „ogłupiania” algorytmów rozpoznawania mowy. Problem w tym, że generatywna sztuczna inteligencja, jak model Whisper od OpenAI, potrafi rekonstruować rozmowy nawet z przetworzonych i zdegradowanych nagrań. Z pozoru bezużyteczne fragmenty mogą posłużyć do złożenia pełnych wypowiedzi.

Dlatego zespół badaczy z Carnegie Mellon postanowił iść o krok dalej. Zamiast tylko utrudniać rozpoznanie mowy, zaprojektowali filtr, który po prostu ją wycina – i to zanim dane opuszczą urządzenie.

Mechanizm działania jest prosty w założeniu, ale zaawansowany technicznie. Kirigami pełni rolę binarnego klasyfikatora – rozpoznaje, czy w danym momencie w sygnale audio występuje ludzka mowa. Jeśli tak, usuwa ją. Co ważne, użytkownik lub deweloper może dostosować próg czułości filtra – może on działać bardzo agresywnie (wycinając nawet fragmenty, które przypominają mowę) lub łagodniej (zostawiając więcej dźwięków kosztem ryzyka, że coś z mowy się przedostanie).

Takie podejście nie tylko chroni prywatność, ale pozwala też zachować przydatność danych w innych zastosowaniach – np. rozpoznawaniu aktywności domowych, jak gotowanie, odkurzanie czy nawet monitorowanie zdrowia.

Potencjalne zastosowania Kirigami wykraczają poza prywatność domową. W jednym z projektów badawczych dźwięk wykorzystywany jest do przypominania osobom z demencją o codziennych czynnościach. Inne zespoły analizują dźwięki w pokoju dziecka z ADHD, by wcześnie wykryć niepokojące symptomy, lub monitorują zmiany zachowania studentów jako wczesne oznaki depresji.

Dzięki zastosowaniu Kirigami, możliwe jest zbieranie takich danych w sposób nieinwazyjny, bez ryzyka, że prywatne rozmowy zostaną gdziekolwiek zarchiwizowane czy przesłane.

W dobie rosnącego sceptycyzmu wobec dużych technologicznych korporacji i ich podejścia do danych użytkowników, technologie takie jak Kirigami pokazują, że można łączyć użyteczność z odpowiedzialnością. Jak podkreślają autorzy projektu, rozwiązanie może być łatwo zaadaptowane przez producentów sprzętu i dostosowane do konkretnych potrzeb – od urządzeń domowych po czujniki w przestrzeni publicznej.

W dłuższej perspektywie Kirigami może stanowić standard w nowych urządzeniach audio, stając się częścią szerszego ruchu w kierunku etycznego projektowania technologii.

Szymon Ślubowski

SUBSKRYBUJ „GAZETĘ NA NIEDZIELĘ” Oferta ograniczona: subskrypcja bezpłatna do 30.04.2025.

Strona wykorzystuje pliki cookie w celach użytkowych oraz do monitorowania ruchu. Przeczytaj regulamin serwisu.

Zgadzam się