Nový Nástroj AI pro Převod Obrázků na GIFy od Microsoft Research

Oddělení výzkumu společnosti Microsoft nedávno představilo průlomový model umělé inteligence nazvaný Pix2Gif, schopný přeměňovat statické obrázky na animované GIFy během několika sekund. Tento inovativní nástroj využívá difúzní model podobný jiným modelům umělé inteligence pro převod textu na video. To, co však Pix2Gif odlišuje, je jeho unikátní přístup k překladu obrazu.

Na rozdíl od tradičních metod, které spoléhají pouze na obrázkový vstup, umožňuje Pix2Gif uživatelům poskytnout textové instrukce pro další úpravu po nahrání obrázku. Kombinací obrázku a textových podnětů model umělé inteligence prostorově transformuje rysy původního obrázku, což vede k dynamickému a poutavému vytváření GIFů.

Abychom lépe porozuměli funkci tohoto nástroje AI, doporučují výzkumníci uživatelům vést model poskytnutím textového podnětu spolu s obrázkovým vstupem. Tento textový průvodce pomáhá nástroji zlepšit vizuální prvky obrázku na základě požadovaného pohybu nebo efektu.

Proces generování GIFu ze statického obrázku trvá s aktuální verzí Pix2Gif přibližně jednu minutu. Je však třeba poznamenat, že s rychlejší grafickou kartou (GPU) může nástroj vyprodukovat GIFy ještě rychleji.

K úklidu modelu umělé inteligence využili výzkumníci rozsáhlý soubor dat obsahující 100 000 animovaných GIFů doplněných příslušnými titulky. Snímky byly extrahovány z těchto GIFů a titulky byly využity jako textový podnět během tréninkového procesu. Díky této rozmanité sbírce dokázal Pix2Gif získat schopnost transformovat obrázky na živé GIFy, jež uchvátí diváky.

I když zatím zůstává tento model umělé inteligence především v rámci výzkumného projektu, existuje možnost začlenění do existujících produktů Microsoftu, jako je Copilot, Designer nebo Paint. Tato integrace by zjednodušila proces animace a umožnila uživatelům snadno aplikovat přídavné vylepšení obrázků řízená umělou inteligencí.

Je důležité zmínit, že výzkumníci dosud nezveřejnili zdroj GIFů použitých pro trénink modelu. V případě, že by se Pix2Gif vyvinul v plnohodnotný produkt Microsoftu, by bylo nezbytné získat licencovaná data pro trénink.

Zvědaví jednotlivci a nadšenci nyní mohou zažít sílu modelu Pix2Gif ve zkouškovém prostředí. Uživatelé mohou pomocí tohoto nástroje nahrát obrázek nebo textový podnět a pozorovat transformaci na plynulý GIF. Navíc Microsoft plánuje zlepšit schopnosti nástroje a potenciálně rozšířit jeho funkčnost v aplikacích pro úpravu obrázků.

The source of the article is from the blog mivalle.net.ar

Privacy policy
Contact