OpenAI dezvăluie un AI revoluționar capabil să simuleze lumea fizică

OpenAI a dezvăluit recent modelul său AI text-la-video fotorealiste revoluționar numit Sora, care reprezintă un avans semnificativ în tehnologia AI generativă. Această inovație remarcabilă are potențialul de a revoluționa diverse domenii dincolo de producția video.

Sora este denumit „simulator de lume” de către OpenAI, deoarece demonstrează o înțelegere a aspectelor importante ale lumii tridimensionale. AI-ul este capabil să genereze scene asemănătoare CGI-ului ale peisajelor digitale sau să creeze video-uri care surprind esența scenariilor din lumea reală, cum ar fi o femeie care merge pe o stradă luminată de neon noaptea.

Cercetătorul din spatele lui Sora, Tim Brooks, explică că capacitatea AI-ului de a înțelege geometria tridimensională și consistența a apărut natural din expunerea la cantități semnificative de date, în loc să fie programată în prealabil. Această descoperire evidențiază potențialul remarcabil al escaladării modelelor de generare video în construirea de simulatoare de uz general ale lumii fizice.

Pentru a antrena Sora, OpenAI i-a furnizat cantități mari de video-uri cu subtitrări, stabilind o conexiune între imagini și intrare text. Această abordare permite AI-ului să genereze materiale video noi pe baza comenzilor, să extindă clipuri existente sau să transforme imagini generate de AI în format video.

Este demn de menționat faptul că cercetătorii OpenAI au observat mai multe capabilități emergente în Sora în timpul dezvoltării sale. AI-ul este capabil să simuleze aspecte ale oamenilor, animalelor și mediilor găsite în lumea fizică. Acest lucru este evident în clipurile generate, care prezintă schimbări dinamice ale camerei și mișcări ușor deosebite, indicând o înțelegere semnificativă a spațiilor tridimensionale.

Aplicațiile potențiale ale lui Sora se extind dincolo de producția video, OpenAI sugerând chiar potențialul său pentru platformele de jocuri. Prin escaladarea modelelor video, ar putea fi dezvoltate simulatoare extrem de capabile atât ale lumilor fizice, cât și digitale, împreună cu locuitorii acestora.

Este important să recunoaștem că Sora are încă unele limite. Modelul nu înțelege complet cauza și efectul, așa cum se arată în cazurile în care o persoană mușcă dintr-o prăjitură, dar prăjitura rămâne intactă sau un pahar se scurge fără a se sparge mai întâi. În ciuda acestor imperfecțiuni, Sora reprezintă o privire într-un viitor în care video-urile generate de AI sunt de nerecunoscut față de realitate.

OpenAI este hotărâtă să abordeze riscurile potențiale asociate cu această tehnologie. Compania intenționează să lanseze treptat Sora pentru a evalua posibilele daune și riscuri cu ajutorul evaluatorilor externi. Asigurarea siguranței este o prioritate principală, deoarece OpenAI recunoaște potențialul de utilizare abuzivă.

În concluzie, Sora de la OpenAI reprezintă o avanpremieră monumentală în tehnologia AI. Capacitatea sa de a simula lumea fizică și de a genera video-uri fotorealiste evidențiază potențialul imens al modelelor de AI generative. Deși există încă provocări de depășit, Sora deschide calea pentru un viitor în care conținutul produs de AI estompează linia dintre real și artificial.

The source of the article is from the blog guambia.com.uy