Revolutionizing Image Transformation with Pix2Motion

Útvarovanie statických obrázkov do animovaných GIFov sa stalo oveľa jednoduchším vďaka novému nástroju Pix2Motion, ktorý nedávno predstavila výskumná divízia spoločnosti Microsoft. Tento inovatívny nástroj využíva umelelú inteligenciu (AI) na rýchlu transformáciu obrázkov do formy GIFov len za niekoľko sekúnd. Pri porovnaní s inými AI modelmi text-to-video využíva Pix2Motion difúzny model. Avšak, to, čo Pix2Motion posúva na vyššiu úroveň, je jeho jedinečný prístup k prekladu obrázkov.

V kontraste s tradičnými metódami, ktoré sa spoľahli len na vstup obrázka, Pix2Motion umožňuje užívateľom poskytnúť textové pokyny pre úpravu po nahraní obrázka. Spojením obrázka aj textových návodov umelelá inteligencia priestorovo transformuje prvky pôvodného obrázka, čo vedie k dynamickému a pútavému vytvoreniu GIFu.

Na lepšie pochopenie toho, ako tento nástroj AI funguje, výskumníci radi odporúčajú užívateľom navigovať model poskytnutím textového návodu spolu s obrázkovým vstupom. Táto textová orientácia pomáha nástroju zlepšiť vizuálne prvky obrázka na základe požadovanej pohybovej animácie alebo efektu.

Proces generovania GIFu z statického obrázka trvá približne jednu minútu s aktuálnou verziou Pix2Motion. Avšak, treba poznamenať, že s rýchlejším grafickým spracovacím jednotkou (GPU) môže nástroj produkovať GIFy ešte rýchlejšie.

Na tréning AI modelu výskumníci využili rozsiahly dataset obsahujúci 100 000 animovaných GIFov sprevádzaných príslušnými popismi. Z týchto GIFov boli extrahované snímky a popisy boli použité ako textové inštrukcie počas tréningového procesu. Vďaka tejto rozmanitej kolekcii Pix2Motion získal schopnosť transformovať obrázky do živých GIFov, ktoré zaujmú divákov.

Aj keď tento model AI zatiaľ zostáva predovšetkým výskumný projekt, existujú možnosti na jeho zahrnutie do existujúcich produktov Microsoftu, ako sú Copilot, Designer, alebo Paint. Táto integrácia zjednoduší animačný proces a umožní užívateľom jednoducho aplikovať AI-ové zlepšenia na svoje obrázky.

Je dôležité uviesť, že výskumníci nezverejnili zdroj GIFov použitých na tréning modelu. V prípade, že sa nástroj Pix2Motion premení na plnohodnotný výrobok Microsoftu, získanie licencovaných dát pre tréning bude nevyhnutné.

Zvedaví jednotlivci a nadšenci môžu teraz zažiť silu Pix2Motion v testovacom prostredí. Používatelia môžu prístupovať k nástroju, nahrať obrázok alebo poskytnúť textový návod a vidieť transformáciu do plynulého GIFu. Navyše, Microsoft plánuje zdokonaliť schopnosti tohto nástroja a potenciálne rozšíriť jeho funkcionalitu v rámci aplikácií na úpravu obrázkov.

Často kladené otázky (FAQ)

1. Čo je Pix2Motion?
– Pix2Motion je model umelej inteligencie vyvinutý výskumnou divíziou spoločnosti Microsoft, ktorý konvertuje statické obrázky do animovaných GIFov. Používa jedinečný prístup k prekladu obrázkov a umožňuje užívateľom poskytnúť ďalšie textové inštrukcie pre úpravu.

2. Ako funguje Pix2Motion?
– Používatelia navigujú model Pix2Motion poskytnutím textového návodu spolu s obrázkovým vstupom. AI algoritmus priestorovo transformuje pôvodný obrázok na základe tejto orientácie, čo vedie k vytvoreniu GIFu.

3. Aký dlhý čas trvá generovanie GIFu s Pix2Motion?
– Aktuálne Pix2Motion potrebuje približne jednu minútu na generovanie 2-sekundového GIFu zo statického obrázka. Avšak, čas spracovania sa môže ďalej znížiť využitím rýchlejšieho GPU.

4. Aké údaje boli použité na tréning modelu Pix2Motion?
– Výskumníci použili dataset obsahujúci približne 100 000 animovaných GIFov s príslušnými popismi. Snímky boli extrahované z týchto GIFov a popisy slúžili ako tréningový textový návod.

5. Bude Pix2Motion zahrnutý do produktov Microsoftu?
– Aj keď je Pix2Motion v súčasnosti výskumný projekt, Microsoft môže zvážiť jeho integráciu do existujúcich produktov ako sú Copilot, Designer, alebo Paint. Takáto integrácia zjednoduší animačný proces a ponúkne AI-ové zlepšenia obrázkov.

Zdroje:
– [Microsoft Research](https://www.microsoft.com/en-us/research/)
– [Tom’s Guide](https://www.tomsguide.com/)

The source of the article is from the blog japan-pc.jp

Privacy policy
Contact