Sora 2 rewolucją w tworzeniu generowanych obrazów od OpenAI
OpenAI wprowadza Sora 2, model sztucznej inteligencji, który tworzy realistyczne wideo z dźwiękiem, fizyką i efektami specjalnymi.
Sztuczna inteligencja coraz śmielej wkracza w dziedzinę kreatywności. OpenAI właśnie podniosło poprzeczkę za sprawą zaprezentowania swojego nowego modelu Sora 2, który obiecuje uczynić produkcję treści bardziej realistyczną, kontrolowalną i immersyjną niż kiedykolwiek wcześniej. Model opisywany jest jako „moment GPT-3.5 dla branży wideo”, Sora 2 stanowi ewolucję oryginalnego modelu Sora z lutego 2024 roku, który był prostym, ale obiecującym krokiem w kierunku rzeczywistej symulacji świata. Teraz, dzięki skalowaniu mocy obliczeniowej, model nie tylko tworzy wizualne sekwencje, ale także synchronizuje je z zaawansowanym dźwiękiem, w tym dialogami i efektami specjalnymi. Narzędzie wprowadza w zakłopotanie nowe generacje grafików i montażystów, którzy zastanawiają się, czy kolejne modele jeszcze bardziej nie zredukują zatrudnienia w branżach firmowych na początkowych stanowiskach juniorskich.
Główne atuty Sora 2 tkwią w jego zdolnościach do symulacji rzeczywistości. Model doskonale radzi sobie z generowaniem złożonych scen. Podczas prezentacji modelu wyświetlane były złożone sekwencje jak olimpijskie ruchy gimnastyczne, czy wiosłowaniu ukazując jak woda, która jest zmorą dla wielu grafików poprzez jej nietypowe ruchy. Sora 2 obsługuje różnorodne style wizualne – od hiperrealistycznego kina po animacje w stylu anime – i wzbogaca je o wyrafinowane ścieżki dźwiękowe. Wyobraź sobie smoczy ryk z subtelnym „Rrhh—” w subsekundowym wydechu, huk spadającego lodowca czy wiry powietrza za skrzydłami latającego gada. Te detale nie są przypadkowe; model emuluje sensory dużych matryc cyfrowych, generując wideo w rozdzielczości 4K przy kącie otwarcia migawki 180 stopni, co zapewnia krystaliczną ostrość i subtelny ziarnisty efekt.
Porównując z pierwszą wersją Sory, ulepszenia są uderzające. Poprzedni model cierpiał na „nadmierny optymizm”, obiekty modyfikowały się w niepożądany sposób, np. kosz do kosza teleportował piłkę zamiast pozwolić jej odbić się od tablicy. Sora 2 przestrzega praw fizyki z żelazną konsekwencją, wzorując się na rzeczywistości, która zostanie mu dostarczona do jej bazy danych.
Podczas demonstracji modelu na kanale YouTube OpenAI zostały ukazane możliwości modelu. Weźmy prompt: „Łyżwiarka figurowa wykonuje potrójnego axela na środku zamarzniętego jeziora”, którego wynikiem była płynna sekwencja ruchów, a kamera śledziła ruch z precyzją.
Nie brakuje jednak troski o etykę i bezpieczeństwo. OpenAI uznaje, że technologia Sora 2 niesie ryzyka, takie jak doomscrolling (bezmyślne przewijanie treści prowadzące do przygnębienia), uzależnienie, nadmierne angażowanie użytkowników czy izolacja społeczna, optymalizowana przez algorytmy uczenia ze wzmocnieniem. Firma walczy z tymi problemami poprzez zaawansowane narzędzia kontroli jak algorytmy rekomendacyjne oparte na języku naturalnym, okresowe ankiety sprawdzające samopoczucie oraz feed zoptymalizowany pod inspirację do tworzenia, a nie maksymalizację czasu spędzonego. Feed faworyzuje treści od obserwowanych osób i motywujące klipy, promując aktywność twórczą nad pasywną konsumpcją.
Dla nastolatków wprowadzono domyślne limity generacji treści dziennie, surowsze zgody na używanie podobizn w cameo oraz kontrole rodzicielskie zintegrowane z ChatGPT. Rodzice mogą wyłączać personalizację algorytmów, ograniczać nieskończone przewijanie, czy zarządzać wiadomościami bezpośrednimi. Użytkownicy mają pełną kontrolę end-to-end nad swoimi podobiznami i mogą w dowolnym momencie cofnąć dostęp do danych wizualnych/audio lub usunąć istniejące wideo, zapewniając ochronę prywatności.
Sora 2 to krok ku symulowanym światom, gdzie AI staje się współtwórcą historii. Może zrewolucjonizować branżę filmową, umożliwiając małym twórcom rywalizować z dużymi studiami, ale rodzi pytania o autentyczność i pracę ludzką. OpenAI obiecuje dalszy rozwój, z kierunkiem na zrównoważony wpływ. W erze, gdy wideo jest królem treści, Sora 2 może być koroną na głowie kreatywności.
Szymon Ślubowski
