Microsoft avslöjar AI som skapar verklighetstroget animerade ansikten

Konstgjord intelligens förvandlar stillbilder till talande porträtt

Microsofts utvecklingsteam har introducerat en toppmodern AI-modell med namnet VASA-1 som kan producera animerade mänskliga ansikten från statiska bilder – en teknik som höjt ögonbryn bland experter. Det här genombrottet delades på företagets officiella blogg.

Verktyget använder en enda fotografi av ett mänskligt ansikte och en medföljande ljudklipp av tal. Även i sitt inledande släpp kan VASA-1 animera ansiktet på bilden genom att anpassa läpprörelserna till ljudet, vilket resulterar i en video som förmedlar ett brett utbud av ansiktsuttryck och naturliga huvudrörelser och förbättrar realismen och livligheten i det genererade innehållet. Microsoft avslöjade att de inte använde verkliga ansikten för testning utan genererade dem med hjälp av StyleGAN2 eller DALL-E 3, vilket resulterade i hyperrealistiska videor med helt fiktiva karaktärer.

Microsoft Tar Försiktighetsåtgärder

Den tekniska jätten erkänner de potentiella riskerna som deras avancerade ramverk, VASA-1, kan innebära. I sin blogg betonar de sitt mål, vilket är att utforska genereringen av visuella emotionella färdigheter för virtuella interaktiva karaktärer och inte att efterlikna verkliga personer.

Enligt Microsoft finns det inga omedelbara kommersiella ambitioner för VASA-1, och de beskriver det som en ren forskningsdemonstration utan ”existerande produkt eller avsikt att släppa en API.” Resultatet är inte felfritt; AI-genererade artefakter är iakttagbara, såsom anomaliskt rörliga tänder och något stel huvudrörelse. Trots detta har VASA-1 fortfarande betydande fördelar jämfört med sina samtida.

Framtiden för AI-genererade videor

Microsofts nya verktyg genererar effektivt videor med en upplösning på 512×512 pixlar vid jämnt 40 bilder per sekund och banar väg för ”realistiska avatarer som efterliknar mänskliga konversationsförmågor”, enligt utvecklarna. Medan nuvarande tillgång är begränsad till allmänheten och privata enheter för kommersiellt bruk har möjligheten att detta ramverk erbjuds som en onlinetjänst i framtiden inte avfärdats. Företaget är dock medvetet om de potentiella farorna med att släppa VASA-1 till allmänheten.

Förstå konsekvenserna av AI-genererade animerade ansikten

Microsofts satsning på AI som kan animera stillbilder förflätas i grund och botten med det bredare området av djupinlärning och syntetisk media. Relevant för VASA-1 och dess kapaciteter är den historiska kontexten av ”deepfakes”, som är syntetiskt genererad media där en person i en befintlig bild eller video ersätts med någon annans likhet. Deepfake-tekniken har sett betydande framsteg de senaste åren och visar både innovativ potential och etiska bekymmer.

Viktiga frågor och utmaningar

Vilka potentiella etiska konsekvenser inför VASA-1? AI-genererat innehåll kan sudda ut gränsen mellan verklighet och förfalskning, vilket kan leda till möjlig missbruk genom spridning av desinformation eller skapande av otillåtet innehåll.

Hur kan denna teknik regleras? Att säkerställa ansvarsfull användning av AI-genererade bilder innebär att utveckla tydliga riktlinjer och regleringar för att förhindra skadlig användning.

Vilka integritetskonsekvenser finns det? Även om Microsoft inte använder verkliga ansikten finns det frågan om samtycke och integritet när det gäller att använda någons liknelse, ett område som för närvarande saknar omfattande lagliga ramar.

Fördelar och nackdelar

Fördelar med VASA-1 inkluderar dess potentiella tillämpning inom underhållning, virtuell verklighet och kundtjänstscenarier där realistiska avatarer kan leda till mer engagerande och mänskliga interaktioner. Det kan också användas i utbildnings- och tränings-simuleringar genom att ge realistiska mänskliga uttryck och reaktioner.

Men ju mer avancerad AI blir, desto större är nackdelarna, inklusive risken att skapa mycket övertygande men falska videor som kan vara svåra att skilja från verkligheten och potentiellt förvärra problemen med desinformation och cyberbedrägeri. Det finns redan en bred oro kring deepfakes och hur de kan påverka politik, personers rykten och allmänhetens förtroende.

Kontroverser och viktiga utmaningar

Den huvudsakliga kontroversen ligger i möjligheten till missbruk av en sådan teknik. Förmågan att skapa verklighetstrogna animationer från stillbilder kan leda till skapandet av bedrägligt innehåll som är omöjligt att upptäcka för den genomsnittliga betraktaren. Det väcker frågor om verifiering, äkthet och etik i syntetiska medier och ger upphov till diskussioner om digitala rättigheter och behovet av teknologiska skyddsåtgärder som digital vattenmärkning och utveckling av detektionsverktyg.

Om du letar efter mer information om utvecklingen av artificiell intelligens och syntetisk media kan Microsofts officiella domän ge relevanta företags- och forskningsinsikter. Deras officiella domän är Microsoft. Kom ihåg vikten av att verifiera URL:en och säkerställa att den leder till rätt huvuddomän när du söker efter resurser eller ytterligare information om ämnet.

The source of the article is from the blog kunsthuisoaleer.nl