Išskirtinis dirbtinio intelekto išradimas: „Microsoft“ VASA-1 sukuria kalbančius vaizdo įrašus iš vaizdų

Microsoft naujausias išradimas aukštesnės kartos dirbtinio intelekto srityje, VASA-1, pasiekė nepaprastą laimėjimą, sėkmingai generuodamas vaizdo įrašus, kurie suteikia iliuziją kalbančios nuotraukos. Ši inovacija sujungia vieną paveikslėlį su garso failu, visapusiškai atgaivindama paveikslą, nuo sinchronizuotų lūpų judesių iki dinamiškų veido išraiškų ir galvos gestų.

Pažanga generatyvinio dirbtinio intelekto srityje, ypač audiovizualinės sintezės, atvėrė duris tokioms pirmtakųkurioms. Pavyzdžiui, OpenAI būsimas produktas „Sora“, numatytas išleisti vėliau šiais metais, demonstravo įspūdingas galimybes konvertuoti tekstą į vaizdo įrašus įvairiose parodose. Be to, OpenAI vystė dirbtinį intelektą, galintį imituoti asmenio balsą net po kelių sekundžių klausymo.

Nors šios funkcijos rodo didelį techninį progresą, jos taip pat turi piktnaudžiavimo galimybių. Galimybe pritvirtinti bet kokį balsą prie bet kurios nuotraukos technologija lengvai galėtų būti naudojama platinant dezinformaciją ar suteršti asmenio reputaciją.

Laimei, „Microsoft“ paaiškino, kad VASA-1 nebus viešas produktas, panašus į „ChatGPT“ ar „Copilot“, ir šiuo metu nėra jokių planų jį komercializuoti. Dauguma „Microsoft“ naudotų vaizdų, skirtų testuoti VASA-1, buvo sugeneruoti dirbtinio intelekto, tokių kaip „StyleGAN2“ ar „Dall-E 3“, tačiau išskirtinis atvejis yra ikoniškoji „Mona Lizos“ nuotrauka.

„Microsoft“ pabrėžia, kad VASA-1 šiuo metu yra tobulinamas kaip tyrimo projektas, tarnaujantis pirmiausia kaip tokių AI galimybių koncepcijos įrodymas. Apibendrinant, nors „Microsoft“ pripažįsta galimybę šią technologiją per ateinančius metus paversti komerciniu produktu, jis pažada imtis tokio žingsnio tik tada, kai technologija bus naudojama atsakingai ir atitinkamai reguliuojama.

Svarbūs klausimai ir atsakymai:

K: Kas yra VASA-1?
A: VASA-1 yra „Microsoft“ sukurtas dirbtinio intelekto programa, galinti sukurti kalbančius vaizdo įrašus iš statybinio paveikslėlio. Ji sintezuoja garso ir vieną paveikslėlį, kad būtų sukuriamas vaizdo įrašas su sinchronizuotais lūpų judesiais, veido išraiškomis ir galvos gestais, sukuriant įspūdį, kad nuotrauka kalba.

K: Kokios galimos problemos gali kilti naudojant VASA-1 technologiją?
A: Vienas pagrindinių susirūpinimų, susijusių su VASA-1 ir panašiomis technologijomis, yra potencialus jų piktnaudžiavimas. Jos gali būti naudojamos platinant dezinformaciją, kurdamos gilias kopijas, imituojant individus ir žalojant reputacijas, keldamos naujus iššūkius skaitmeninio turinio autentifikavimui ir asmeninei saugumui.

Pagrindiniai iššūkiai ir ginčai:

Pagrindinis iššūkis slypi galimu tokių technologijų piktnaudžiavimu, kuris gali privedti prie gilių kopijų, beveik neįmanomų atskirti nuo tikrų vaizdo įrašų. Tai kelia etinių ir teisinių klausimų, tokių kaip sutikimas, privatumas ir klaidingos informacijos platinimas. Be to, kyla susirūpinimas viešu pasitikėjimu ir sunkumais nustatant audiovizualinio turinio autentiškumą.

Privalumai ir trūkumai:

Privalumai:
– Inovacijos kaip VASA-1 gali pervers gyvybiškai svarbias sritis, tokią kaip virtualūs asistentai, švietimas, pritaikyta pramoga ir klientų aptarnavimas, suteikdamos interaktyvesnes ir realistiškesnes patirtis.
– Jos pritaikomos meno ir istorinio švietimo srityse, kur nuotraukose esantys asmenys gali būti atgaivinami, kad įtrauktų auditoriją.
– Technologija gali padėti kalbų vertimo paslaugose, demonstruodama realistišką lūpų sinchronizaciją skirtingomis kalbomis.

Trūkumai:
– Technologija gali būti piktnaudžiaujama kurdama apgaulingą turinį, įskaitant gilesnius kopijus, kurie platinamą dezinformaciją ar manipuliuoja individų vaizdais.
– Yra rizika, kad viešas pasitikėjimas žiniasklaida sumažės, kai vis sunkiau nustatyti tikrąjį ir dirbtinio intelekto generuojamą turinį.
– Galimi teisiniai ir reguliavimo klausimai dėl kažkieno panaudojimo be sutikimo.

Siūlomi susiję nuorodos:
„Microsoft“ oficiali svetainė
„OpenAI“ oficiali svetainė

Kad išspręstumėte šiuos susirūpinimus, svarbu, kad organizacijos sukurtų etikos gaires ir teisines nuostatas, kurios galėtų prisitaikyti prie technologinių naujovių. Kadangi dirbtinis intelektas vis tobulėja, tampa vis svarbiau pasiekti pusiausvyrą tarp inovacijų ir etinės atsakomybės.

The source of the article is from the blog publicsectortravel.org.uk