Microsoft dezvăluie AI care convertește imagini statice în videoclipuri realiste folosind sunetul

Inteligența Artificială Creează Video-uri din Fotografii

Microsoft Research Asia a prezentat un model revoluționar de inteligență artificială (IA) capabil să creeze video-uri ‘deepfake’ extrem de realiste pornind de la o singură imagine statică, asociată cu un clip audio. IA a fost instruită pe aproximativ 6,000 de imagini ale fețelor vorbitoare din setul de date VoxCeleb2, ceea ce îi permite nu doar să sincronizeze precis cu înregistrarea audio furnizată, dar și să genereze video-uri extrem de realiste.

IA de Următoare Generație Transformă Imaginile Statice în Video-uri Dinamice

Pe lângă sincronizarea buzelor, acest nou model de IA dă viață diferitelor expresii faciale și mișcări naturale ale capului, toate derivate dintr-o singură fotografie. Avansat, dar similar cu Modelul de Sinteza Audio2Video al Institutului Alibaba Smart Computer, VASA-1 de la Microsoft poate genera video-uri sincronizate la 40 de cadre pe secundă cu un ‘neglijabil întârziere inițială’ la o rezoluție de 512×512 pixeli.

Capacitățile surprinzătoare ale IA au fost demonstrate folosind exemple remarcabile din lumea reală și fotografii de referință generate de IA, inclusiv StyleGAN2 sau DALL-E, pentru a evidenția capacitatea modelului de a depăși setul său de antrenament. Un exemplu notabil a prezentat celebrul tablou – Mona Lisa – prinzând viață sub formă de rap.

În plus, modelul vine cu controale opționale care permit ajustări precum dinamica facială, expresiile, stările emoționale și chiar distanța percepută la camera video virtuală.

O Nouă Fereastră către Interacțiunea Umană Îmbunătățită de IA

O declarație introductivă în cadrul unui articol detaliat sugerează că apariția fețelor vorbitoare generate de IA deschide o fereastră către un viitor în care tehnologia îmbunătățește bogăția interacțiunilor umane cu umane și cu IA. Tehnologia promite să îmbunătățească comunicarea digitală, să crească accesibilitatea pentru cei cu deficiențe de comunicare, să transforme educația prin intermediul interacțiunii cu IA, și să ofere suport terapeutic și interacțiune socială în serviciile de sănătate.

Inteligența Artificială la Avantgarda Generării Realiste a Mediilor

Prezentarea de către Microsoft a unei tehnologii IA care animează imagini statice în video-uri dinamice folosind sunetul asociat este o dezvoltare de vârf în domeniul tehnologiei de deepfake și de creare a mediilor. Acest tip de IA are implicatii largi și potențiale de utilizare, atingând industrii precum divertismentul, educația și telecomunicațiile.

Întrebările Eticii și Verificării

Una dintre cele mai importante întrebări care apare odată cu capacitatea de a crea video-uri realiste din imagini este cea a eticii și a potențialului pentru abuz. Deepfake-urile au fost un subiect fierbinte datorită potențialului lor de a fi folosite pentru răspândirea de dezinformări, crearea de reprezentări false ale indivizilor și impactul asupra confidențialității și securității. Verificarea autenticității devine o provocare critică, deoarece devine tot mai dificil să deosebești conținutul generat de IA de videoclipurile autentice.

Avantaje și Dezavantaje ale Video-urilor Generate de IA

Există mai multe avantaje ale acestei tehnologii, printre care:
– Accesibilitate: Poate ajuta potențial cei cu deficiențe de comunicare generând video-uri de vorbire naturale.
– Educație și Instruire: Experiențele de învățare interactive pot fi îmbunătățite cu ajutorul figurilor AI realistice, îmbunătățind implicarea utilizatorului.
– Divertisment: Industriile filmelor și jocurilor video pot folosi tehnologia pentru a crea personaje realiste fără actori fizici, economisind timp și resurse.

În mod concomitent, dezavantajele includ:
– Probleme Etice: Ușurința cu care se pot crea deepfake-uri ridică preocupări privind răspândirea dezinformării și crearea de media necoerente.
– Probleme de Confidențialitate: Există un potențial de abuz prin animarea fotografiilor fără consimțământul individului.
– Riscuri de Securitate: Siguranța națională și siguranța personală ar putea fi compromisă de deepfake-uri care creează dovezi false sau care impersonalizează figuri publice.

Pentru cei interesați să exploreze potențialele și îngrijorările IA în domeniul creării de conținut, următoarele domenii principale ar putea oferi perspective suplimentare:
– Microsoft: Descoperiți inovațiile continue ale companiei în domeniul IA și poziția lor privind utilizarea etică a IA.
– DeepMind: Explorați cercetarea de vârf a IA care abordează unele dintre aceste provocări cheie.
– OpenAI: Câștigați cunoștințe despre dezvoltările AI și considerațiile etice de la una dintre organizațiile de cercetare de vârf.

Având în vedere aceste aspecte, apariția unei astfel de capacități de IA de către Microsoft Research Asia solicită nu doar o evaluare tehnică, dar și considerații etice, elaborarea de politici și discuții publice pentru a stabili norme, reglementări și măsuri de protecție împotriva utilizării în scopuri abuzive.

[Incorporare]https://www.youtube.com/embed/n-FJ09Erm4k[/Incorporare]

The source of the article is from the blog coletivometranca.com.br