OpenAI Sora. Postęp, którego nie potrzebujemy

Firma OpenAI pokazała możliwości swojego nowego produktu. Sora – czyli generator wideo z tekstu – potrafi tworzyć filmy do złudzenia przypominające realny świat. To postęp, którego nie potrzebujemy. Naprawdę.

przezGosia Fraser

19/02/2024

3 minute read

Czy Sora to naprawdę to, czego potrzebujemy?

Firma OpenAI Samuela Altmana pokazała swój nowy produkt – generator wideo z tekstu – Sora. To oparte o sztuczną inteligencję narzędzie, które potrafi tworzyć materiały wideo do złudzenia przypominające rzeczywistość na podstawie krótkiego polecenia tekstowego.

Pojawienie się narzędzia Sora, które obecnie ma być dostępne wyłącznie dla niewielkiej grupy artystów i twórców filmowych a także ekspertów badających możliwe zagrożenia i ryzyko związane z jego nieprawidłowym użyciem, wywołało burzę i falę nowych obaw – w szczególności dotyczących użycia go do tworzenia deep fake’ów.

Jak działa Sora?

Narzędzie Sora opiera swoje działanie na technologii, którą wykorzystuje też generator obrazów DALL-E. W skrócie – Sora interpretuje polecenie tekstowe użytkownika, które następnie rozwija w dużo bardziej szczegółowy „zestaw instrukcji”, a później generuje w oparciu o nie wideo, wykorzystując model, który był szkolony zarówno na nagraniach, jak i na obrazach.

OpenAI pokazując algorytm Sora chwali się tym, że to właśnie technologia spółki Altmana stoi za ogromną poprawą jakości wideo generowanego przez algorytmy – o jak najlepsze wyniki w tej kwestii ścigają się wszyscy najwięksi gracze, w tym Google, Meta i Stable Diffusion.

OpenAI to nie jedyna firma, która stworzyła narzędzie do generowania filmów z polecenia tekstowego. Google testuje algorytm Lumiere, Meta – model Emu, od dawna też są na rynku narzędzia wspomagające tworzenie efektów specjalnych przy użyciu AI w przemyśle filmowym.

Po co nam algorytmicznie generowane wideo?

Stawką w tym wyścigu jest dominacja na rynku, splendor oraz finansowanie ze strony kolejnych inwestorów. Rozwój tego typu technologii nie odbywa się jednak bezkosztowo – a cenę za niego płacimy wszyscy.

Na łamach TECHSPRESSO.CAFE można przeczytać, że sztuczna inteligencja i coraz bardziej zaawansowane algorytmy do generowania materiałów graficznych oraz wideo to jeden z najtrudniejszych aspektów ryzyka, z jakim przyjdzie nam się mierzyć w 2024 roku – roku wyborczym na całym świecie.

Eksperci podkreślają, że materiały generowane przez AI są coraz doskonalsze i mogą z łatwością oszukać ludzkie oko – w szczególności, gdy mówimy o deep fake’ach (pisaliśmy o nich w naszym serwisie w 2019 roku w tym tekście).

Deep fakes to problem – jak przypomina dziennik „Washington Post”, najnowsze kontrowersje dotyczą użycia AI do wygenerowania głosu byłego prezydenta USA Donalda Trumpa. W Pakistanie zaś były premier tego kraju stworzył cyfrową wersję samego siebie, która mimo tego, iż polityk jest w więzieniu – wygłasza publiczne przemówienia do jego zwolenników.

Zagrożenia? Nie tylko polityczne

Kiedy rozmawiamy o zagrożeniach związanych z szybkim rozwojem generatywnej sztucznej inteligencji, pierwszym tematem zawsze jest polityka. Warto jednak spojrzeć na te kwestie szerzej – problemem jest również wypieranie przez AI osób zatrudnianych w branżach takich, jak np. film, czy dźwięk (dubbing i usługi związane z udzielaniem głosu za chwilę być może przestaną być opłacalne, gdy mowa o ich świadczeniu przez człowieka).

Algorytmy sztucznej inteligencji generatywnej mogą zagrażać roli człowieka w tworzonej przez niego rzeczywistości – to tym bardziej przykra konstatacja, jeśli zdamy sobie sprawę, że najpierw zostały one wytrenowane na ludzkiej pracy, takiej jak literatura, film czy prace plastyczne.

Artyści, których dorobek został wykorzystany do szkolenia algorytmów, podobnie jak dziennikarze, domagają się rekompensaty – firmy rozwijające nowe technologie jednak ani myślą czegokolwiek im wynagradzać. Dobrym przykładem tego rodzaju sprawy może być pozew skierowany przez wydawców dziennika „New York Times” przeciwko firmie OpenAI.

Czy tego właśnie potrzebujemy?

Ostatecznie, warto zadać sobie pytanie – czy w czasie wielkich przetasowań na arenie geopolitycznej, zaostrzającego się kryzysu klimatycznego i problemów socjalnych w wielu krajach na całym świecie (jak np. rosnące nierówności społeczne czy brak mieszkań) naprawdę potrzebujemy nowych technologii pozwalających na łatwe generowanie opartych o AI materiałów wideo?

Sora to postęp, który nie ma sensu i wartości poza tymi, które przyczynią się do zwiększenia kapitalizacji rynkowej OpenAI. Może warto powiedzieć to sobie otwarcie – w przerwie między peanami i wyrazami zdumienia nad geniuszem przemiłego Samuela „Sama” Altmana.

Dodaj komentarz Anuluj pisanie odpowiedzi

Powiązane teksty

Czytaj dalej

Technologie

Nowego wspaniałego świata nie będzie. Kolejne firmy rezygnują z metawersum

Kolejne firmy rezygnują z działów odpowiedzialnych za rozwój metawersum – nowego, cyfrowego świata, w którym rzeczywistość wirtualna miała przenikać się z realną. Struktury rozwiązały m.in. Microsoft i Disney.

przezGosia Fraser

Czytaj dalej

Felietony

Rada ds. Cyfryzacji rekomenduje zakaz TikToka polskim urzędnikom. Co to oznacza?

Rada ds. Cyfryzacji zarekomendowała w poniedziałek zakaz instalacji i używania TikToka na urządzeniach służbowych polskiej administracji publicznej. Co to oznacza w praktyce i ile znaczy zalecenie organu doradczego ministra właściwego ds. cyfryzacji?

przezGosia Fraser

Czytaj dalej

Chińskie aplikacje szturmują nasze telefony i nie jest to wyłącznie TikTok

Kiedy myślimy o chińskich aplikacjach, do głowy przychodzi nam przede wszystkim TikTok, który od dłuższego już czasu budzi ogromne polityczne kontrowersje. Jednak nie tylko przez TikToka Państwo Środka przebojem wdziera się w nasze życie.

przezGosia Fraser

Czytaj dalej

Czy naprawdę potrzebujemy sztucznej inteligencji w muzyce?

Sztuczną inteligencję postrzegamy często jako coś związanego z nowymi technologiami, biznesem czy polityką, ale nie z muzyką. Świat sztuki często wchłania SI z entuzjazmem – pozwala jej komponować lub wręcz występować na scenie, jak w przypadku Opery Drezdeńskiej i spektaklu „Chasing Waterfalls”. Ku swojej zgubie.

przezMateusz Ciupka

Ostatnio dodane:

W 2025 r. X straci miliony użytkowników

Czy polska prezydencja w Radzie UE rozwiąże problem spyware?

Czy potrzebujemy spisu zawodów chronionych przed wpływem AI?

Ile znaczą nasze dane genetyczne?

OpenAI Sora. Postęp, którego nie potrzebujemy

Jak działa Sora?

Po co nam algorytmicznie generowane wideo?

Zagrożenia? Nie tylko polityczne

Czy tego właśnie potrzebujemy?

Dodaj komentarz Anuluj pisanie odpowiedzi