Microsoft dezvăluie Inteligență Artificială care convertește imagini statice în clipuri video realiste folosind sunetul

Inteligența Artificială Creează Video-uri din Fotografii

Microsoft Research Asia a dezvăluit o nouă tehnologie revoluționară de inteligență artificială (AI) capabilă să creeze video-uri extrem de realiste ‘deepfake’ pornind de la o singură imagine statică însoțită de un clip audio. AI-ul a fost antrenat pe aproximativ 6.000 de imagini cu fețe vorbitoare din setul de date VoxCeleb2, ceea ce îi permite nu doar să sincronizeze buzele cu înregistrarea audio furnizată în mod precis, dar și să genereze video-uri incredibil de realiste.

Inteligența Artificială a Noii Generații Transformă Imaginile Statice în Video-uri Dinamice

Pe lângă sincronizarea buzelor, acest nou model AI aduce la viață diverse expresii faciale și mișcări naturale ale capului, toate derivate dintr-o singură fotografie. Avansat dar asemănător cu Modelul de Sinteză Audio2Video al Institutului Alibaba Smart Computer, VASA-1 de la Microsoft poate genera video-uri sincronizate la 40 cadre pe secundă cu un ‘delai inițial neglijabil’ la o rezoluție de 512×512 pixeli.

Capacitățile surprinzătoare ale AI-ului au fost demonstrate folosind exemple reale notabile și fotografii de referință generate de AI, inclusiv StyleGAN2 sau DALL-E, pentru a evidenția capacitatea modelului de a depăși setul său de antrenare. Un exemplu notabil a fost reprezentat de celebrul tablou – Mona Lisa – prinzând viață într-o interpretare rap.

În plus, modelul vine cu controale opționale care permit ajustări precum dinamica facială, expresiile, stările emoționale și chiar distanța percepută față de camera video virtuală.

O Nouă Fereastră către Interacțiunea Umană Îmbunătățită de AI

O declarație introductivă într-un articol detaliat sugerează că apariția fețelor vorbitoare generate de AI deschide o fereastră către un viitor în care tehnologia îmbunătățește bogăția interacțiunii umane-umane și umane-AI. Tehnologia promite să îmbunătățească comunicarea digitală, să crească accesibilitatea pentru cei cu deficiențe de comunicare, să transforme educația prin intermediul interacțiunii cu AI, și să ofere suport terapeutic și interacțiune socială în serviciile de sănătate.

Inteligența Artificială la Aproape de Generarea Realistă a Mediilor

Dezvăluirea de către Microsoft a unei tehnologii AI care animează imagini statice în video-uri dinamice folosind un sunet însoțitor reprezintă o dezvoltare de vârf în domeniul tehnologiei deepfake și de creare a mediilor. Acest tip de AI are implicări și potențiale de utilizare cu amplitudine largă, atingând industrii precum divertismentul, educația și comunicațiile.

Întrebări Etice și de Verificare

Una dintre cele mai importante întrebări care apar odată cu capacitatea de a crea video-uri realiste din imagini este cea a eticii și potențialului de abuz. Deepfake-urile au fost un subiect fierbinte datorită utilizării lor potențiale în răspândirea dezinformării, crearea de reprezentări false ale indivizilor și impactul asupra confidențialității și securității. Verificarea autenticității devine o provocare critică, pe măsură ce devine tot mai dificil să distingi conținutul generat de AI de videoclipurile autentice.

Avantaje și Dezavantaje ale Video-urilor Generate de AI

Există mai multe avantaje ale acestei tehnologii, inclusiv:
– Accesibilitate: Poate ajuta potențial pe cei cu deficiențe de comunicare prin generarea de video-uri naturale ale discursului.
– Educație și Instruire: Experiențele de învățare interactive pot fi îmbunătățite cu personaje AI realiste, îmbunătățind implicarea utilizatorului.
– Divertisment: Industriile filmului și jocurilor pot folosi această tehnologie pentru a crea personaje realiste fără actori fizici, economisind timp și resurse.

În mod echivalent, dezavantajele includ:
– Îngrijorări Etice: Ușurința de a crea deepfake-uri ridică preocupări legate de răspândirea dezinformării și crearea de conținut neprevăzut.
– Probleme de Confidențialitate: Există un potențial de abuz prin animarea fotografiilor fără consimțământul unei persoane.
– Riscuri de Securitate: Securitatea națională și siguranța personală ar putea fi compromise de deepfake-uri care creează dovezi false sau impersonază figuri publice.

Pentru cei interesați să exploreze potențialele și preocupările inteligentei artificiale în domeniul creației de conținut, următoarele domenii majore pot oferi perspective suplimentare:
– Microsoft: Descoperiți inovațiile continue ale companiei în domeniul AI și poziția lor referitoare la utilizarea etică a inteligenței artificiale.
– DeepMind: Explorați cercetarea AI de vârf care abordează unele dintre aceste provocări cheie.
– OpenAI: Obțineți cunoștințe despre dezvoltările AI și considerațiile etice de la una dintre principalele organizații de cercetare.

Având în vedere aceste aspecte, apariția unor capacități AI de către Microsoft Research Asia solicită nu doar evaluări tehnice, ci și considerente etice, elaborarea politicilor și discuții publice pentru a stabili norme, reglementări și măsuri de protecție împotriva abuzului.

The source of the article is from the blog portaldoriograndense.com