Uus AI-mudel "Sora" surub tekstist-video loomise piire

OpenAI, mida tuntakse oma mõjukate AI tööriistade nagu ChatGPT ja Dall-E poolest, on nüüd avaldanud oma viimase loomingu nimega Sora, AI-genereritud videomudeli. See läbimurdemudel ühendab “diffusioonimudeli” ja “transformeri” jõu, et ennustada ja luua videosekvtsid ulatusliku koolitusandmete põhjal.

Erinevalt oma eelkäijatest paistab Sora silma võimega luua erinevat tüüpi videoid, ulatudes fotorealistlikest kuni animeeritud ja isegi eksentrilisteni, maksimaalse pikkusega kuuskümmend sekundit. Kuigi see pole veel avalikkusele testimiseks saadaval, on OpenAI poolt näidisvideote avaldamine tekitanud märkimisväärset elevust, paljud ootavad põnevusega võimalust seda esmakordselt proovida.

Sora võimeid silmas pidades näitavad esimesed muljed, et ta on ületanud varasemad tekstist-video tööriistad kvaliteedi ja järjepidevuse osas. Samal ajal kui varasemad AI-genereritud videod kannatasid sageli järjepidamatuse ja moonutuste all, lahendab Sora need väljakutsed otseselt. OpenAI väidab, et Sora suudab luua keerukaid stseene mitme tegelasega, simuleerida liikumist füüsilises maailmas ning täpselt kujutada objekti püsivust. Tulemuseks on visuaalselt koherentne videokogemus, mis säilitab illusiooni katkematult.

Kuigi Sora on saavutanud märkimisväärseid edusamme, ei ole sellel siiski piiranguid. OpenAI tunnistab, et Sora võib võidelda keeruliste füüsika stsenaariumide täpse simulatsiooni, põhjuse ja tagajärje suhete mõistmise ning ruumiliste detailide täpse kujutamisega. Olulised detailid, nagu konkreetne GPT mudel, mida Sora arendamiseks kasutati, koolitusandmed, väljalaskekuupäev ja hind, on avaldamata.

Siiski demonstreerivad esimesed näited Sora videote loomise võimekust selle potentsiaalset mõju erinevates tööstusharudes. Alates haaravate ulmefilmide treilerite ja õpetlike toiduvalmistamise sessioonide loomisest kuni Pixar-stiilis animeeritud lühifilmide ja üldkasuliku õhuvaatekaadrite valmistamiseni on Soral potentsiaal revolutsiooniks videote tootmise, kinematograafia, mängunduse ja isegi sotsiaalmeedia sisuloome valdkondades.

Kuigi oodatakse rohkem teavet ja laiemat juurdepääsu Sorale, on vaieldamatu, et see viimane AI-mudel on juba surunud piire selle kohta, mida saab saavutada tekstist-video loomise valdkonnas. Tulevikuvõimalused Sorale ja selle mõju visuaalsele jutustamisele on kahtlemata põnevad, tõstatades küsimusi AI-genereritud videote uskumatust potentsiaalist tulevikus.

The source of the article is from the blog yanoticias.es