OpenAI Pristato Sorą: Išpildantis vaizduotės su gyvaam AI video kūrimą

OpenAI, inovatyvus dirbtinio intelekto srityje lyderis, neseniai pristatė naujausią savo dirbtinio intelekto modelį vardu Sora. Šis pirmavęs modelis turi neįtikėtiną gebėjimą generuoti realizuotas ir vaizduotės praturtinamas 60 sekundžių video tik pagal teksto nurodymus.

Naudojantis Soru, vartotojai gali tiesiog pateikti teksto instrukcijas ir stebėti modelio nuostabų gabumą kurti vaizdo įrašus, atitinkančius jų specifikacijas. Tai apima scenas su daugybe personažų, tam tikrą judesio tipą ir itin detalų foną. Tai, kas išskiria Sorą iš kitų tekstui į vaizdą pagrįstų modelių, yra jo supratimas, kaip šie elementai egzistuoja fiziniame pasaulyje, kaip nurodyta OpenAI tinklaraštyje.

„Mes siekiame kurti dirbtinio intelekto modelius, kurie galėtų padėti žmonėms spręsti realaus pasaulio problemas, kurioms būtina sąveika su fiziniu aplinkos”, teigė OpenAI.

Reece’as Hayden’as, vyriausiasis analitikas iš rinkos tyrimų bendrovės ABI Research, pabrėžė tokie dirbtinio intelekto modeliai kaip ir Sora potencialų poveikį skaitmeninio pramogų rinkai. Jo nuomone, gebėjimas kurti individualizuotą turinį per trumpus vaizdo kadruotės gali pertvarkyti būdą, kaip naratyvai yra palaikomi televizijoje ir kituose medijos kanaluose.

Nors Sora demonstruoja puikų ilgį ir tikslumą, OpenAI pripažįsta, kad tai yra procesas, kuriam dar turi būti dirbama. Vietinių detalių, pvz., skirtumo tarp kairės ir dešinės, bei priežasties ir pasekmės sąryšio supratimas yra kelios sritys, kurios dar kelia iššūkius modeliui. OpenAI pateikė pavyzdį, kai Sora sukūrė video, kur matėsi, kaip kažkas kramto sausainiuką ir nėra paliktas įkandimo žymės.

Be to, OpenAI lieka pasiryžę siekti saugumo ir yra sukaupę ekspertų komandą, kuri visapusiškai vertina Sorą. Baimės keliančios sritys apima dezinformaciją, nekęstingą turinį ir šališkumą. Bendrovė aktyviai kuria įrankius, kad aptiktų klaidinančią informaciją ir sumažintų galimus rizikos veiksnius.

Norėdami gauti vertingų įžvalgų ir atsiliepimų, OpenAI planuoja suteikti ankstyvąjį prieigą prie Soros kibernetinio saugumo profesoriams, garsinsiems kaip „raudoni komandos nariai”, taip pat vizualinių menininkų, dizainerių ir kino kūrėjų. Toks bendradarbiavimas užtikrina įvairialypę perspektyvą tyrinėjant Soros potencialias taikymo sritis įvairiose kūrybinėse srityse.

Kol OpenAI toliau tobulina savo dirbtinio intelekto galimybes, naujausias ChatGPT atnaujinimas dėl atminties funkcijos leidžia vartotojams kontroliuoti platformos prisiminimo buvusių pokalbių. Ši įdomi funkcija suteikia vartotojams galimybę asmeniškai pritaikyti būsimus pokalbius arba visiškai pašalinti ankstesnius pokalbius, gerinant pokalbio patirtį.

OpenAI Sora žymi svarbų žingsnį į priekį dirbtinio intelekto kuriant vaizdo įrašus srityje, atveriant naujus vaizduotės ir meninio išraiškos plotus. Su savo galimybe revoliucionizuoti turinio kūrimą pramogų pramonėje, Sora praneša apie žadančią ateitį, kurioje dirbtinio intelekto aktyvumas bendradarbiauja su žmogiška vaizduote, kuriant nuostabius naratyvus.

DUKK:
Kas yra Sora?
Sora yra naujausias OpenAI išleistas dirbtinio intelekto modelis, kuris gali generuoti realizuotas ir vaizduotės praturtinamas 60 sekundžių video tik pagal teksto nurodymus.

Ką vartotojai gali daryti su Soru?
Vartotojai gali pateikti teksto nurodymus Sorai ir matyti, kaip modelis kuria video atitinkančius jų specifikacijas. Tai apima scenas su daugybe personažų, tam tikrą judesio tipą ir itin detalų foną.

Kuo išsiskiria Sora nuo kitų išteksto į vaizdą modelių?
Soros supratimas, kaip elementai egzistuoja fiziniame pasaulyje, suteikia jai pranašumų prieš kitus išteksto į vaizdą modelius. Ji siekia kurti dirbtinio intelekto modelius, kurie gali padėti žmonėms spręsti realaus pasaulio problemas, reikalaujančias sąveikos su fizine aplinka.

Koks potencialus dirbtinio intelekto modelių, pvz., Soros, poveikis skaitmeninio pramogų rinkai?
Reece’as Hayden’as, vyriausiasis analitikas, teigia, kad dirbtinio intelekto modelių, tokio kaip Soros, galimybė kurti individualizuotą turinį per trumpus kadro momentus gali pertvarkyti būdą, kaip naratyvai yra palaikomi televizijoje ir kituose medijos kanaluose.

Kokios iššūkiai dar lieka Soroje?
Sora vis dar susiduria su iššūkiais vietinės detalės, pvz., skirtumo tarp kairės ir dešinės, bei priežasties ir pasekmės sąryšio supratimu.

Ką OpenAI daro siekdama pirmumo saugos srityje?
OpenAI sukaupė ekspertų komandą, kuri nuodugniai vertina Sorą, ypač atsižvelgdama į saugumo rizikas, tokią kaip dezinformacija, nekęstingas turinys ir šališkumas. Bendrovė aktyviai kuria įrankius, kad aptiktų klaidinančią informaciją ir sumažintų potencialius rizikos veiksnius.

Kas turės ankstyvąją prieigą prie Soros?
OpenAI planuoja suteikti ankstyvąją prieigą prie Soros kibernetinio saugumo profesoriams, vizualiniams menininkams, dizaineriams ir kino kūrėjams, kad gautų vertingų įžvalgų ir atsiliepimų. Toks bendradarbiavimas užtikrina įvairialypę perspektyvą tyrinėjant Soro potencialias taikymo sritis įvairiose kūrybinėse srityse.

Kokios naujausios naujienos dėl ChatGPT atminties funkcijos?
Naujausias ChatGPT atnaujinimas dėl atminties funkcijos leidžia vartotojams kontroliuoti platformos prisiminimo buvusių pokalbių. Vartotojai gali asmeniškai pritaikyti būsimus pokalbius arba visiškai pašalinti ankstesnius pokalbius.

Ką simbolizuoja Sora dirbtiniam intelektui kuriant video?
Sora žymi svarbų žingsnį į priekį dirbtinio intelekto kuriant video srityje, atveriant naujus vaizduotės ir meninio išraiškos plotus. Ji turi potencialą revoliucionizuoti turinio kūrimą pramogų pramonėje, bendradarbiaujant su žmogiška vaizduote, kad būtų kuriami įtraukiantys naratyvai.

Apibrėžimai:
– Dirbtinis intelektas (AI): Programa arba sistema, skirta imituoti arba atkartoti žmogaus intelektą arba elgesį.
– Modelis: Programa ar sistemą, skirta imituoti arba atkartoti žmogaus intelektą arba elgesį.
– Teksto nurodymai: Rašytiniai nurodymai ar klaidos, kurios duodamos dirbtinio intelekto sistemai, kad būtų sukurtas tam tikras rezultatas.
– Šališkumas: Nukrypimas arba nusistatymas už ar prieš kažką ar kažką.
– Dezinformacija: Netikras ar klaidingas informacija.
– Naratyvas: Pasakojimas apie įvykius arba apibūdinimas.
– Kibernetinė sauga (Cybersecurity): Priežiūros priemonės, skirtos apsaugoti kompiuterinius sistemų ir tinklų nuo neleistino prieigos ar puolimo.
– Vizualiniai menininkai: Asmenys, kurie kuria meną įvairiais būdais, tokius kaip tapyba, skulptūra, fotografija ir pan.
– Dizaineriai: Specialistai, kurie kuria dizainus funkciniais ir estetiniais tikslais įvairiose srityse.
– Kino kūrėjai: Asmenys, kurie dalyvauja filmų kūrime, įskaitant režisūrą, produkciją ir montavimą.

The source of the article is from the blog macnifico.pt

Privacy policy
Contact