Novi AI model “Sora” pomera granice generiranja teksta u videozapisima

OpenAI, poznat po svojim utjecajnim alatima umjetne inteligencije poput ChatGPT-a i Dall-E-a, sada je predstavio svoje najnovije stvaranje nazvano Sora, model videozapisa generiran umjetnom inteligencijom. Ovaj prekretnički model kombinira snagu “modelske difuzije” i “transformatora” kako bi predvidio i generirao videozapise na temelju obimnih podataka za obuku.

Za razliku od svojih prethodnika, Sora se ističe po sposobnosti stvaranja različitih vrsta videozapisa, od fotorealističkih do animiranih pa čak i ekscentričnih, s maksimalnom duljinom od šezdeset sekundi. Iako još nije javno dostupan za testiranje, objava uzoraka videozapisa od strane OpenAI-a izazvala je značajno uzbuđenje, s mnogima koji nestrpljivo čekaju priliku da ga isprobaju iz prve ruke.

Rane dojmove o sposobnostima Sore sugeriraju da je nadmašio prethodne alate za pretvaranje teksta u videozapise po pitanju kvalitete i dosljednosti. Dok su raniji AI-generirani videozapisi često patili od nesuglasica i iskrivljenja, Sora se suprotstavlja tim izazovima. OpenAI navodi da Sora može stvarati složene scene s više likova, simulirati kretanje u fizičkom svijetu i točno predstaviti trajnost objekata. Rezultat je vizualno koherentno iskustvo videozapisa koje održava iluziju bez prekida.

Unatoč svojim značajnim postignućima, Sora nije bez svojih ograničenja. OpenAI priznaje da mu može biti izazovno precizno simulirati kompleksnu fiziku u sceni, razumijeti uzročno-posljedične odnose i točno predstaviti prostorne detalje. Važni detalji poput specifičnog GPT modela korištenog za razvoj Sore, upotrijebljenih podataka za obuku, datuma izlaska i cijene, ostaju neobjavljeni.

Ipak, rani primjeri mogućnosti generiranja videozapisa od strane Sore pokazuju njezin potencijalni utjecaj na različite industrije. Od stvaranja uvjerljivih trejlera znanstvene fantastike i uputstava za kuhanje do produkcije animiranih kratkih filmova u stilu Pixara i generičkih zračnih snimaka za skladište, Sora ima potencijal da revolucionizira područja produkcije videozapisa, kinematografije, igara pa čak i stvaranja sadržaja na društvenim mrežama.

I dok se s nestrpljenjem iščekuje objava više informacija i širi pristup Sori, neosporno je da je ovaj najnoviji AI model već pomaknuo granice onoga što se može postići u području pretvaranja teksta u videozapise. Buduće mogućnosti za Soru i njezin utjecaj na vizualno pripovijedanje nedvojbeno su intrigantne, otvarajući pitanja o nevjerojatnom potencijalu AI-generiranih videozapisa u godinama koje dolaze.

The source of the article is from the blog meltyfan.es

Privacy policy
Contact