ShengShu-AI i Tsinghua University – chińskie firmy technologiczne zaprezentowały w sobotę narzędzie Vidu – model sztucznej inteligencji, który będzie przetwarzał tekst na wideo przy pomocy AI. Brzmi jak konkurencja dla powstającego programu Sora od OpenAI?
Jasne, to oczywista odpowiedź Chin na wysoce zaawansowane narzędzie, ale czy konkurencyjne? Vidu została zaprezentowane w wersji testowej i należy oczekiwać, że firmy jeszcze będą pracować nad udoskonaleniem jego możliwości. Przede wszystkim – warto zwrócić uwagę na fakt, że jest to pierwszy w Chinach model video, który potrafi wygenerować materiał o dłuższym czasie trwania.
Vidu to chińska odpowiedź na Sorę od OpenAI
Vidu może wygenerować 16-sekundowy klip wideo 1080p za pomocą jednego kliknięcia. Wystarczy wpisać odpowiedni prompt i czekać na efekty. Jest zbudowany na opracowanej przez siebie architekturze modelu transformacji wizualnej o nazwie Universal Vision Transformer (U-ViT), integrującej dwa modele AI typu tekst-wideo Diffusion i Transformer. Vidu jest szybką odpowiedzią Chin na Sorę od OpenAI.
Po wydaniu Sory stwierdziliśmy, że jest ona ściśle zgodna z naszą techniczną mapą drogową, co dodatkowo zmotywowało nas do zdecydowanego przyspieszenia naszych badań
Zhu Jun – główny naukowiec ShengShu-AI
Vidu to na pewno nie jedyne zaawansowane narzędzie AI do generowania wideo, które pojawi się rynku
Patrząc na pierwsze efekty Vidu można stwierdzić, że twórcy Sory mogą spać w spokoju. Niemniej jednak, gdyby nie widział próbek możliwości modelu od OpenAI to bym był pod wrażeniem. Panda grająca na gitarze, czy kosmonauta w bibliotece wyglądają efektownie, ale mam wrażenie, że płynność nie jest taka, jak być powinna. Niektóre obrazy są niezwykle sztuczne.
Zaznaczam jednak najważniejszy fakt – moje odczucia wynikają z porównań z bardziej zaawansowanym narzędziem. Inna rzecz – jak finalnie oba modele będę generować wideo? Ważnym elementem na pewno będzie czas tworzenia materiałów i jak sprawnie program będzie odczytywał prompty.
Wyścig firm o dominacje na rynku modeli wideo właśnie się rozpoczął. Kto go wygra? Mam wrażenie, że przekonamy się od tym szybciej niż nam się wydaje, bo konkurencja nie śpi. I to na pewno nie jedyna firma, która będzie chciała jak najszybciej zaprezentować alternatywną możliwość tworzenia wideo, jakich nie powstydziłyby się hollywodzkie filmy, czy seriale.
Żródło: Global Time