AI idealizują młodzież

Obrazy AI idealizują młodzież

Badanie ujawnia, jak obrazy generowane przez AI idealizują młodzież, tworząc wyidealizowany, nierealistyczny wizerunek

Jeśli korzystałeś z narzędzi sztucznej inteligencji (AI) przez jakiś czas, mogłeś zauważyć, że zarówno teksty, jak i obrazy generowane przez te systemy bywają dość schematyczne, wygładzone i pozbawione głębi. Niektórzy mogliby nazwać je „pozbawionymi duszy”.

Profesor Gunhild Kvåle z Uniwersytetu w Agder określa to jako „głos ChatGPT, który daje mi dziwne uczucie święszczenia”. Wraz z kolegą Gustavem Westbergiem z Uniwersytetu w Örebro w Szwecji, postanowiła zbadać, jak narzędzie AI Dall-E 3 tworzy obrazy nastolatków. Dall-E to generator obrazów wbudowany w ChatGPT.

Jednym z celów badania, które zostało opublikowane w czasopiśmie „Discourse & Society”, było zrozumienie, co powoduje to uczucie „sztuczności” w obrazach tworzonych przez AI. Badacze odkryli, że generowane obrazy mają cztery wspólne cechy, które czasem mogą budzić obawy.

Pozorna różnorodność Jedną z pierwszych obserwacji była równoczesna obecność różnorodności etnicznej i płciowej oraz brak rzeczywistej różnorodności na głębszym poziomie. Aby uzyskać reprezentatywną próbę obrazów do porównania, badacze wydawali narzędziu ogólne polecenia, takie jak „utwórz obrazy nastolatków”. Ponadto poprosili AI o samodzielne wygenerowanie promptów tekstowych do stworzenia obrazów.

Można zauważyć, że przedstawione na obrazach nastolatki reprezentują różne grupy etniczne. ChatGPT, generując prompty, szczególnie mocno podkreślał potrzebę różnorodności, co sugeruje, że firmy stojące za technologią uwzględniły wcześniejsze krytyki dotyczące braku różnorodności w starszych wersjach.

Niemniej jednak, jak zauważa Kvåle, „młodzi ludzie na obrazach są uderzająco podobni. Wszyscy noszą dżinsy i buty Converse, mają idealne rysy twarzy i bujne włosy, a żaden z nich nie ma pryszczy. To wyraźna reprezentacja młodych, pięknych i odnoszących sukcesy nastolatków.”

Szczęście na pokaz Kolejną wspólną cechą obrazów była ich pozytywna aura. Młodzi ludzie są przedstawiani podczas nauki, koncertów, pieczenia pianek czy nawet współpracy nad lokalnym ogrodem społecznościowym.

„Wszystkie osoby na obrazach są szczęśliwe, nikt nie jest smutny. Wszyscy angażują się w działania, które są cenione społecznie, ale żaden obraz nie przedstawia ich w pracy czy podczas snu. To raczej przedstawienie czasu wolnego młodzieży z wyższej klasy średniej” – mówi Kvåle.

Warto zauważyć, że te pozytywne przedstawienia mają swoje ograniczenia. Wszystkie postacie są szczupłe, a nawet bezpośrednie polecenia nie mogły tego zmienić. Technologia wyznacza jasne granice tego, jakie obrazy można tworzyć. Chociaż intencje są dobre, wpływają na stereotypy i normy społeczne, utrwalając określony obraz młodzieży.

Prawie realistyczne, ale nie do końca Trzecią wspólną cechą obrazów generowanych przez Dall-E była ich stylizacja na realistyczne fotografie. Oświetlenie, umiejscowienie przedmiotów w tle i na pierwszym planie – to wszystko miało na celu naśladownictwo autentyczności.

Sceny przedstawiane na obrazach różniły się – od parków i klubów młodzieżowych po sceny koncertowe i zabałaganione pokoje nastolatków. Chociaż obrazy stwarzały wrażenie autentyczności, to jednocześnie przedstawiały młodzież w określonych kontekstach społecznych, z dala od problemów codzienności, takich jak praca czy ubóstwo.

Ograniczenia wyobraźni Czwartym odkryciem była zdolność AI do przedstawiania sytuacji wykraczających poza realizm, takich jak młodzież jeżdżąca na deskorolce wewnątrz śnieżnej kuli na biegunie północnym. Takie przedstawienia były jednak rzadkością i wymagały ścisłych instrukcji.

„Fotorealistyczne obrazy są wyraźnie preferowane przez Dall-E. Czasami przekształcają się w ilustracje graficzne, ale standardem jest fotorealizm” – tłumaczy Kvåle.

Krytyczna świadomość Generatory obrazów, takie jak Dall-E 3, są coraz bardziej zaawansowane i dostępne dla wszystkich. Mimo to, jak zauważa Kvåle, nie jesteśmy zalewani obrazami tworzonymi przez AI. Instytucje, redakcje i działy komunikacji wciąż trzymały się swoich standardów branżowych, a wprowadzenie AI nie zmieniło tego z dnia na dzień.

Naukowcy byli jednocześnie zaskoczeni tym, jak bardzo podobne do siebie były generowane obrazy. „Usługi takie jak Dall-E mogą mieć silny wpływ na naszą kulturę wizualną. Powinniśmy być świadomi tych obrazów i krytycznie je analizować, ponieważ nie odzwierciedlają one społeczeństwa, którego chcielibyśmy” – konkluduje Kvåle. „To sprawia, że świat staje się trochę bardziej nudny.”

Szymon Ślubowski

SUBSKRYBUJ „GAZETĘ NA NIEDZIELĘ” Oferta ograniczona: subskrypcja bezpłatna do 30.04.2025.

Strona wykorzystuje pliki cookie w celach użytkowych oraz do monitorowania ruchu. Przeczytaj regulamin serwisu.

Zgadzam się