Megérkezett a Microsoft Research forradalmi új AI eszköze az Image-to-GIF átalakításhoz

A Microsoft kutatási részlege nemrégiben bemutatta a Pix2Gif nevű forradalmi mesterséges intelligencia (AI) modellt, amely a statikus képeket animált GIF-fé változtatja néhány másodperc alatt. Ez az innovatív eszköz azokra a szövegekre épül, amelyeket más szöveg-videó AI modellekhez hasonló difúziós modell használatával, mint ahogy a Pix2Gif is. Azonban ami a Pix2Gif-et kiemeli a többi közül, az az egyedi megközelítése az képfordításnak.

A hagyományos módszerektől eltérően, ahol egyedül csak képi inputra alapoznak, a Pix2Gif lehetővé teszi a felhasználók számára, hogy a kép feltöltése után további szerkesztési utasításokat adjanak szöveges formátumban. Az AI modell a képi és szöveges információkat összekombinálva térbelileg átalakítja az eredeti kép jellemzőit, dinamikus és lenyűgöző GIF létrehozását eredményezve.

Ahhoz, hogy jobban megértsük, hogyan működik ez az AI eszköz, a kutatók azt tanácsolják, hogy az felhasználók irányítsák a modellt szöveges prompt-okkal az képi input mellett. Ez a szöveges irányítás segít az eszköznek a kép vizuális elemeit fokozni a kívánt mozgás vagy hatás alapján.

A GIF létrehozása egy statikus képbő os legalább egy perceges folyamat a jelenlegi Pix2Gif verzió segítségével. Fontos megjegyezni azonban, hogy egy gyorsabb grafikus feldolgozó egységgel (GPU) a gép képes lehet még rövidebb idő alatt GIF-eket létrehozni.

Az AI modell tréningjéhez a kutatók egy nagy adathalmazt használtak, amely mintegy 100,000 animált GIF-et tartalmazott releváns feliratokkal. Időkereteket vettek ki ezekből a GIF-ekből, és a feliratokat használták a szöveges promptokhoz a tréningfolyamat során. Ennek a diverz gyűjteménynek a felhasználásával a Pix2Gif megszerezte a képességet, hogy élénk GIF-ekké alakítsa át a képeket, amelyek lenyűgözik a nézőket.

Bár ez az AI modell főként egy kutatási projekt, lehetséges, hogy beépítik a már meglévő Microsoft termékekbe, mint például a Copilot, a Designer vagy a Paint. Ez az integráció egyszerűsítené az animációs folyamatot, és lehetővé tenné a felhasználóknak, hogy könnyedén alkalmazzák az AI-alapú javításokat képeikre.

Fontos megemlíteni, hogy a kutatók nem hozták nyilvánosságra azokat a GIF-eket, amelyeket a modell tréningjére használtak. Abban az esetben, ha a Pix2Gif teljesen befejezett Microsoft termékké válik, a licencekkel rendelkező adatok beszerzése elengedhetetlen lesz.

Kíváncsi egyének és lelkesek most már teszt környezetben élhetik át a Pix2Gif erejét. Az eszköz elérésével a felhasználók feltölthetnek egy képet vagy szöveges promptot, és tanúi lehetnek annak átalakításának egy sima GIF-fé. Emellett a Microsoft tervezi, hogy finomítja az eszköz képességeit, esetlegesen kiterjesztve annak funkcionalitását a képszerkesztő alkalmazásokon belül.

The source of the article is from the blog kewauneecomet.com

Privacy policy
Contact