Sora: OpenAI pažanga tekstui į vaizdo įrašo generavimą

OpenAI, žinoma kompanija stovinti už ChatGPT, neseniai pristatė prasmingą žingsnį generatyvine dirbtine intelekta. Jų naujausias kūrinys, vadinamas Sora, yra tekstui į vaizdo įrašus verčiantis generatorius, galintis akimirksniu pagaminti trumpus vaizdo įrašus atsakydamas į parašytas komandas. Nepaisant to, kad panašios technologijos buvo demonstruotos Google, Meta ir Runway ML kompanijų, OpenAI sukurti aukštos kokybės vaizdo įrašai paliečia stebėtojus ir tuo pačiu metu kelia susirūpinimą dėl etinių ir visuomeninių padarinių.

Skirtingai nei kiti tekstui į vaizdo įrašus verčiantys generatoriai, Sora sužavėjo dėmesį sugebėjimu veiklai iškelti į gyvenimą įtikinamai. Kai OpenAI generalinis direktorius Sam Altman pakvietė socialinių tinklų naudotojus siūlyti parašytas užduotis, užduotis apie „vieną močiutę, socialinių tinklų įtaką turinčią, vedančią instrukcinę gamybos sesiją, skirtą naminei teslos gamybai, vykdomą tosčioniškoje toskanų šalies virtuvėje su kino šviesa” patraukė Altmano akis. Per trumpą laiko tarpą Altmano atsakymas buvo realistiškas vaizdo įrašas, sėkmingai atitinkantis užduoties aprašymą.

Nors OpenAI neskelbia konkrečių detalių apie Sora konstravimą ar vaizdų ir vaizdo įrašų šaltinius, naudojamus jo mokymui, kompanija veikia atsargiai. OpenAI pareiškė, kad sieks bendradarbiauti su menininkais, politikais ir pramonės ekspertais, prieš padarant įrankį viešai prieinamu. Šis bendradarbiavimas siekia išspręsti su technologijos naudojimu susijusias problemas, tokias kaip dezinformacija, neapykanta ir pasipriešinimas.

Be to, OpenAI aktyviai kuria įrankius, skirtus kovoti su klaidinančiu turiniu, kurį sukuria Sora. Jie dirba su aptikimo klasifikatoriumi, kuris gali nustatyti, ar vaizdo įrašas buvo sukurtas tekstui į vaizdo įrašo generatoriaus. Įgyvendindami priemones, skirtas identifikuoti ir užkirsti kelią klaidinančių vaizdo įrašų plitimui, OpenAI demonstruoja savo pasiryžimą atsakingai inovuoti.

Sora žymi svarbų žingsnį dirbtinio intelekto srityje, išplečiantį generatyvinių modelių siūlomas kūrybines galimybes. OpenAI pasiryžimas konsultuotis su ekspertais ir spręsti su šia technologija susijusius potencialius rizikos momentus yra pripažinimas žingsnis siekiant užtikrinti atsakingą jos naudojimą ateityje. Kuomet Sora toliau vystosi, pasaulis su nekantrumu laukia galimybių ir iššūkių, kuriuos sukelia šis naujas dirbtinį intelektą naudojantis vaizdo įrašais paremtas AI žingsnis.

DUK:

1. Kas yra Sora?
Sora yra OpenAI sukurtas tekstui į vaizdo įrašus verčiantis generatorius, galintis akimirksniu pagaminti trumpus vaizdo įrašus atsakydamas į parašytas komandas.

2. Kuo Sora skirtas nuo kitų tekstui į vaizdo įrašus verčiančių generatorių?
Sora išsiskiria savo sugebėjimu įtikinamai gyvai paversti užduotis ir generuoti aukštos kokybės vaizdo įrašus.

3. Kokia užduotis patraukė OpenAI generalinio direktoriaus Sama Altmano dėmesį?
Užduotis, kuri patraukė Sama Altmaną, buvo „vieną močiutės, socialinių tinklų įtaką turinčios, vedančios instrukcinę gamybos sesiją, skirtą naminei teslos gamybai, vykdomą tosčioniškoje toskanų šalies virtuvėje su kino šviesa.”

4. Ar OpenAI atskleidė detales apie Soros konstravimą?
Ne, OpenAI neskelbia konkrečių detalių apie Soros konstravimą ar vaizdų ir vaizdo įrašų šaltinius, naudojamus jo mokymui.

5. Kokį požiūrį OpenAI įžvelgia dėl Soros viešojo prieinamumo?
OpenAI pasiryžta bendradarbiauti su menininkais, politikais ir pramonės ekspertais prieš padarant Sorą viešai prieinamu, siekiant išspręsti problemas ir užtikrinti atsakingą technologijos naudojimą.

6. Ar OpenAI aktyviai stengiasi kovoti su klaidinančiu turiniu, kurį sukuria Sora?
Taip, OpenAI aktyviai vysto aptikimo klasifikatorių, kuris gali identifikuoti tekstui į vaizdo įrašo generatoriaus sukurtus vaizdo įrašus ir užkirsti kelią klaidinančio turinio plitimui.

7. Koks yra OpenAI tikslas su Sora?
OpenAI siekia išplėsti generatyvių modelių siūlomas kūrybines galimybes ir užtikrinti atsakingą dirbtinių intelektu paremtų vaizdo įrašų naudojimą, konsultuojantis su ekspertais ir spręsdamas su šia technologija susijusius potencialius rizikos momentus.

Apibrėžimai:

Tekstui į vaizdo įrašus verčiantis generatorius: Technologija, kuri verčia rašytinį tekstą į vaizdo įrašo turinį.

Generatyvieji modeliai: Sis žiniatinklapis nėra kaip žmonės verčiami į lietuvių, aiškinimai. Yra minima, kad tai dirbtinio intelekto modeliai, kurie generuoja naują turinį remiantis esamais duomenimis. Dažnai naudojami gilusis mokymas.

Aptikimo klasifikatorius: Įrankis arba algoritmas, naudojamas identifikuoti tam tikrus modelių ar charakteristikų šablonus duomenyse. Šiuo atveju nustatomas, ar vaizdo įrašas buvo sukurtas tekstui į vaizdo įrašo generatoriaus.

The source of the article is from the blog crasel.tk