OpenAI Sora. Postęp, którego nie potrzebujemy

Firma OpenAI pokazała możliwości swojego nowego produktu. Sora – czyli generator wideo z tekstu – potrafi tworzyć filmy do złudzenia przypominające realny świat. To postęp, którego nie potrzebujemy. Naprawdę.
Czy Sora to naprawdę to, czego potrzebujemy?

Firma OpenAI pokazała możliwości swojego nowego produktu. Sora – czyli generator wideo z tekstu – potrafi tworzyć filmy do złudzenia przypominające realny świat. To postęp, którego nie potrzebujemy. Naprawdę.

Firma OpenAI Samuela Altmana pokazała swój nowy produkt – generator wideo z tekstu – Sora. To oparte o sztuczną inteligencję narzędzie, które potrafi tworzyć materiały wideo do złudzenia przypominające rzeczywistość na podstawie krótkiego polecenia tekstowego.

Pojawienie się narzędzia Sora, które obecnie ma być dostępne wyłącznie dla niewielkiej grupy artystów i twórców filmowych a także ekspertów badających możliwe zagrożenia i ryzyko związane z jego nieprawidłowym użyciem, wywołało burzę i falę nowych obaw – w szczególności dotyczących użycia go do tworzenia deep fake’ów.

Jak działa Sora?

Narzędzie Sora opiera swoje działanie na technologii, którą wykorzystuje też generator obrazów DALL-E. W skrócie – Sora interpretuje polecenie tekstowe użytkownika, które następnie rozwija w dużo bardziej szczegółowy „zestaw instrukcji”, a później generuje w oparciu o nie wideo, wykorzystując model, który był szkolony zarówno na nagraniach, jak i na obrazach.

OpenAI pokazując algorytm Sora chwali się tym, że to właśnie technologia spółki Altmana stoi za ogromną poprawą jakości wideo generowanego przez algorytmy – o jak najlepsze wyniki w tej kwestii ścigają się wszyscy najwięksi gracze, w tym Google, Meta i Stable Diffusion.

OpenAI to nie jedyna firma, która stworzyła narzędzie do generowania filmów z polecenia tekstowego. Google testuje algorytm Lumiere, Meta – model Emu, od dawna też są na rynku narzędzia wspomagające tworzenie efektów specjalnych przy użyciu AI w przemyśle filmowym.

Po co nam algorytmicznie generowane wideo?

Stawką w tym wyścigu jest dominacja na rynku, splendor oraz finansowanie ze strony kolejnych inwestorów. Rozwój tego typu technologii nie odbywa się jednak bezkosztowo – a cenę za niego płacimy wszyscy.

Na łamach TECHSPRESSO.CAFE można przeczytać, że sztuczna inteligencja i coraz bardziej zaawansowane algorytmy do generowania materiałów graficznych oraz wideo to jeden z najtrudniejszych aspektów ryzyka, z jakim przyjdzie nam się mierzyć w 2024 roku – roku wyborczym na całym świecie.

Eksperci podkreślają, że materiały generowane przez AI są coraz doskonalsze i mogą z łatwością oszukać ludzkie oko – w szczególności, gdy mówimy o deep fake’ach (pisaliśmy o nich w naszym serwisie w 2019 roku w tym tekście).

Deep fakes to problem – jak przypomina dziennik „Washington Post”, najnowsze kontrowersje dotyczą użycia AI do wygenerowania głosu byłego prezydenta USA Donalda Trumpa. W Pakistanie zaś były premier tego kraju stworzył cyfrową wersję samego siebie, która mimo tego, iż polityk jest w więzieniu – wygłasza publiczne przemówienia do jego zwolenników.

Zagrożenia? Nie tylko polityczne

Kiedy rozmawiamy o zagrożeniach związanych z szybkim rozwojem generatywnej sztucznej inteligencji, pierwszym tematem zawsze jest polityka. Warto jednak spojrzeć na te kwestie szerzej – problemem jest również wypieranie przez AI osób zatrudnianych w branżach takich, jak np. film, czy dźwięk (dubbing i usługi związane z udzielaniem głosu za chwilę być może przestaną być opłacalne, gdy mowa o ich świadczeniu przez człowieka).

Algorytmy sztucznej inteligencji generatywnej mogą zagrażać roli człowieka w tworzonej przez niego rzeczywistości – to tym bardziej przykra konstatacja, jeśli zdamy sobie sprawę, że najpierw zostały one wytrenowane na ludzkiej pracy, takiej jak literatura, film czy prace plastyczne.

Artyści, których dorobek został wykorzystany do szkolenia algorytmów, podobnie jak dziennikarze, domagają się rekompensaty – firmy rozwijające nowe technologie jednak ani myślą czegokolwiek im wynagradzać. Dobrym przykładem tego rodzaju sprawy może być pozew skierowany przez wydawców dziennika „New York Times” przeciwko firmie OpenAI.

Czy tego właśnie potrzebujemy?

Ostatecznie, warto zadać sobie pytanie – czy w czasie wielkich przetasowań na arenie geopolitycznej, zaostrzającego się kryzysu klimatycznego i problemów socjalnych w wielu krajach na całym świecie (jak np. rosnące nierówności społeczne czy brak mieszkań) naprawdę potrzebujemy nowych technologii pozwalających na łatwe generowanie opartych o AI materiałów wideo?

Sora to postęp, który nie ma sensu i wartości poza tymi, które przyczynią się do zwiększenia kapitalizacji rynkowej OpenAI. Może warto powiedzieć to sobie otwarcie – w przerwie między peanami i wyrazami zdumienia nad geniuszem przemiłego Samuela „Sama” Altmana.

Total
0
Shares
Dodaj komentarz

Twój adres e-mail nie zostanie opublikowany. Wymagane pola są oznaczone *

Powiązane teksty
Total
0
Share