Inovativní nástroj AI od Microsoft Research Asia proměňuje statické obrázky ve mluvící videa.

Revoluční umělá inteligence vytváří realistická videa z fotografií
Výzkumníci v oblasti umělé inteligence v Microsoft Research Asia učinili průlom krokem svým nejnovějším experimentem, VASA-1. Tento pozoruhodný nástroj umělé inteligence dokáže animovat statický lidský portrét nebo kresbu synchronizací s audio souborem a vytvořit realistické video osoby mluvící nebo zpívající. Technologie je schopna generovat mimiku a pohyby hlavy, které odpovídají rytmu mluveného slova nebo melodii.

Pokročilá umělá inteligence klade etické otázky
Na projektovou webovou stránku bylo nahráno mnoho příkladů schopností této technologie. I když její výstup je impozantní a některé výsledky působí klamně realisticky, při bližším zkoumání můžete všimnout jemně robotického charakteru pohybů. Přestože vědci zdůrazňují tato běda, technologie vyvolala obavy ohledně jejího potenciálního zneužití při vytváření přesvědčivých deepfake videí.

Vědci, kteří si jsou vědomi těchto důsledků, se rozhodli technologii nepublikovat, včetně online demo, API nebo podrobností k implementaci. Tento opatrný přístup je přijat s cílem zajistit, že nástroj nebude zneužit a bude dodržovat etické normy. Umělá inteligence je také navržena tak, aby nefungovala s obrázky známých osobností, aby bylo zabráněno možným padělkům.

Slibné využití mimo zábavu
Navzdory riziku zneužití má technologie VASA-1 mnoho prospěšných aplikací. Například by mohla posílit vzdělávací rovnost tím, že poskytne avatary pro komunikačně postižené osoby, umožní jim vyjádřit se skrze AI generovaného mluvčího. Navíc výzkumníci předpokládají, že nástroj by mohl usnadnit terapeutickou podporu a být integrován do interaktivních programů s postavami umělé inteligence, vytvářející virtuální bytosti, se kterými mohou uživatelé komunikovat.

Klíčové otázky a odpovědi:

Co je to za technologii VASA-1 a kdo ji vyvinul?
VASA-1 je nástroj umělé inteligence vyvinutý výzkumníky z Microsoft Research Asia. Dokáže animovat statický lidský portrét nebo kresbu, synchronizovat ji s audio souborem a vytvořit realistické video osoby mluvící nebo zpívající.

Jaké etické otázky přináší VASA-1?
Technologie vyvolává etické otázky kvůli potenciálnímu zneužití při tvorbě deepfake videí, což vedlo výzkumníky k rozhodnutí nepublikovat technologii veřejně.

Jaké jsou některé prospěšné aplikace technologie VASA-1?
VASA-1 by mohla poskytnout avatary pro komunikačně postižené osoby, poskytovat terapeutickou podporu a být integrována do interaktivních programů s postavami umělé inteligence.

Výhody a nevýhody:

Výhody:
– VASA-1 má potenciál pomoci jedincům s komunikačními obtížemi poskytováním virtuálního mluvčího.
– Může pozitivně přispět k vzdělávání, zdravotnictví a zábavě prostřednictvím interaktivních programů s umělou inteligencí.
– Realistická syntéza řeči a pohybů může pomoci výzkumu v oblasti umělé inteligence a multimédií.

Nevýhody:
– Existuje významné riziko zneužití pro tvorbu deepfake, což může vést k dezinformacím a podkopání důvěry v digitální média.
– Opatrný přístup vývojářů v nepublikování technologie omezuje přístupnost pro výzkumníky a vývojáře, kteří by mohli nalézt benevolentnější využití nebo další inovace.

Klíčové výzvy a kontroverze:
Hlavní výzvou je vyvinout ochrany proti zneužití technologie, která může generovat přesvědčivá falešná videa. Kontroverze vznikají z otázek souvisejících s dovolením, ochranou osobních údajů a možností vytvářet videa, která klamou diváky nebo míří na podvádění jednotlivců bez jejich povolení.

Související odkazy:
Pro více informací o práci této organizace navštivte Microsoft Research.

The source of the article is from the blog tvbzorg.com