Microsoft razvija AI koji može stvarati videe u kojima se govori na temelju fotografija i uzoraka glasa

Microsoftovi istraživači nedavno su predstavili tehnologiju umjetne inteligencije dizajniranu za izradu hiperrealističnih videozapisa ‘govorećeg lica’ na temelju jedne fotografije i uzorka glasa. Ovaj inovativni proboj istaknut je na priznatom Mobile World Congressu u Barceloni, odražavajući prednosti tvrtke u telekomunikacijskom sektoru.

Tehnologija nazvana VASA-1 ne cilja stvaranje varljivog sadržaja ili dezinformacija. Umjesto toga, Microsoft je naglasio važnost korištenja ovog napretka za pozitivne primjene poput virtualnih avatara i drugih blagotvornih svrha. Istaknuli su svoj stav protiv bilo koje upotrebe koja bi mogla potencijalno stvarati lažne ili štetne sadržaje koji uključuju stvarne osobe.

Unatoč prepoznavanju potencijala za zloupotrebu u krađi identiteta, mogućnosti upotrebe AI generativne tehnologije su široke, krećući se od unapređivanja inkluzivnog obrazovanja do pružanja pomoći u komunikaciji i terapeutskoj podršci. Ove sposobnosti potaknule su Microsoft da postupa oprezno, suzdržavajući se od objavljivanja ovog alata ili njegovih tehničkih detalja do sada. Potvrđuju svoju predanost odgovornoj upotrebi koja se usklađuje s trenutnom regulativom prije nego što je učine široko dostupnom.

Druga poduzeća, uključujući Runway i istraživače tvrtke Google sa svojim modelom Vlogger AI, također istražuju ovo područje. Brzi napredak AI u generiranju sadržaja budi i divljenje zbog impresivnih primjena i zabrinutost zbog mogućeg iskorištavanja, što potiče regulatorna tijela poput Europske unije da napišu povijesnu zakonodavnu regulativu kako bi osigurali odgovornu inovaciju u području AI.

Činjenice:
– AI koji može stvoriti videa govorećeg lica na temelju fotografija i uzoraka glasa ima značajan potencijal za unapređenje interakcije između ljudi i računala, olakšavajući ljudima interakciju s digitalnim sučeljima na prirodniji i personaliziraniji način.
– Takva tehnologija bi mogla biti izuzetno korisna za stvaranje digitalnih asistenata, alata za učenje jezika te personaliziranih avatara u igrama ili virtualnoj stvarnosti.
– Razvoj ove tehnologije spada unutar šireg područja dubokog učenja i računalnog vida, koji su rapidno rasli u proteklom desetljeću zbog napretka u algoritmima, dostupnosti podataka i računalne snage.
– Microsoftov pristup etičkim pitanjima odražava šire trendove industrije kada je riječ o razvoju smjernica i okvira kako bi se osigurala odgovorna upotreba AI.

Ključna pitanja i odgovori:
– P: Koje su primarne etičke brige oko tehnologije AI koja omogućava stvaranje videa?
<b: A: Primarne etičke brige uključuju potencijal za stvaranje deepfakeova, kršenje privatnosti, pitanja pristanka i širenje dezinformacija, što bi moglo imati implikacije na osobnu sigurnost, politiku i društveno povjerenje.

– P: Kako planiraju tvrtke poput Microsofta umanjiti rizike povezane s ovom tehnologijom?
<b: A: Tvrtke ističu odgovornu upotrebu tehnologije, usklađivanje s regulativama i potencijalno ograničavanje pristupa tehnologiji dok se ne uspostave etički okviri.

Ključni izazovi i kontroverze:
– <b:Izazov: Ključan izazov je usklađivanje inovacija s etičkim implikacijama i sprječavanje zloupotrebe. Tehnologija bi se mogla koristiti za stvaranje deepfakeova ili u druge zlonamjerne svrhe ako dođe u pogrešne ruke.
– <b:Kontroverza: Postoji kontinuirana rasprava o razini regulacije potrebnoj za sprječavanje zloupotrebe bez gušenja inovacija i iskorištavanja pozitivnih primjena tehnologije.

<b:Prednosti i nedostaci:
– <b:Prednosti:
– Stvaranje videozapisa AI može unaprijediti digitalnu komunikaciju, nudeći učinkovita iskustva i pristupačnost ljudima s invaliditetom.
– Može smanjiti troškove i vrijeme u medijskoj produkciji, posebno za stvaranje personaliziranog sadržaja ili sadržaja na više jezika.
– Tehnologija može služiti obrazovnim i terapeutskim svrhama stvaranjem interaktivnih i privlačnih okruženja.

– <b:Nedostaci:
– Postoji visok rizik stvaranja uvjerljivih deepfakeova koji mogu doprinijeti dezinformacijama, s ozbiljnim društvenim i političkim posljedicama.
– Brige o privatnosti, jer tehnologija zahtijeva korištenje osobnih podataka (fotografije i uzorci glasa) koji bi mogli biti zloupotrijebljeni.
– Mogući negativni utjecaj na tržište rada za glumce, osobe za sinkronizaciju glasa i druge stručnjake u kreativnoj industriji.

Za više informacija o Microsoftu, posjetite njihovu web stranicu na sljedećoj poveznici: Microsoft.