Vzpostavitev novih standardov s tehnologijo GIPC v slikovni obdelavi

Raziskovalna divizija podjetja Microsoft je nedavno predstavila prebojni model umetne inteligence (AI), imenovan GIPC, ki je zmožen statičnim slikam v nekaj sekundah dodati animacijo v obliki GIF-ov. Ta inovativno orodje, znano kot Pix2Gif, uporablja difuzijski model, podoben drugim modelom AI, namenjenim pretvorbi besedila v video. Vendar pa to, kar loči Pix2Gif od drugih, je njegov edinstven pristop k prevajanju slik.

Za razliko od tradicionalnih metod, ki temeljijo le na slikovnem vnosu, Pix2Gif uporabnikom omogoča, da po nalaganju slike posredujejo tudi navodila besedila za nadaljnje urejanje. Z združevanjem slikovnega in besedilnega vodenja AI modeli prostorsko preoblikujejo značilnosti izvirne slike, kar vodi do dinamičnega in privlačnega ustvarjanja GIF-ov.

Za boljše razumevanje načina delovanja tega orodja za umetno inteligenco raziskovalci uporabnikom svetujejo, naj model vodijo s posredovanjem besedilnega navodila skupaj z vnosom slike. Ta besedilna usmeritev pomaga orodju izboljšati vizualne elemente slike na podlagi željenega gibanja ali učinka.

Postopek ustvarjanja GIF-a iz še slike trenutno traja približno eno minuto s trenutno različico Pix2Gif. Vendar pa velja omeniti, da lahko z uporabo hitrejše grafične obdelave enote (GPU) orodje proizvaja GIF-je v še krajšem času.

Za usposabljanje modela umetne inteligence so raziskovalci uporabili obsežen nabor podatkov, ki vključuje 100.000 animiranih GIF-ov skupaj z relevantnimi napisi. Okvirji so bili izvlečeni iz teh GIF-ov, napisi pa so bili uporabljeni kot besedilna navodila med postopkom usposabljanja. S tem raznolikim zbirkam je Pix2Gif pridobil sposobnost spreminjanja slik v živahne GIF-e, ki pritegnejo gledalce.

Čeprav je ta model umetne inteligence trenutno še vedno predvsem raziskovalni projekt, obstajajo možnosti, da ga vključimo v obstoječe Microsoftove izdelke, kot so Copilot, Designer ali Paint. Takšna integracija bi poenostavila postopek animacije in omogočila uporabnikom enostavno uporabo izboljšav, ki jih ponuja umetna inteligenca.

Pomembno je omeniti, da raziskovalci niso razkrili vira GIF-ov, uporabljenih za usposabljanje modela. V primeru, da se Pix2Gif razvije v polno oblikovani produkt podjetja Microsoft, bo pridobitev licenciranih podatkov za usposabljanje bistvenega pomena.

Radovedni posamezniki in navdušenci lahko sedaj preizkusijo moč Pix2Gif v testnem okolju. Z dostopom do orodja lahko uporabniki posredujejo sliko ali besedilno navodilo in vidijo preobrazbo v brezhiben GIF. Poleg tega Microsoft načrtuje izboljšati zmogljivosti orodja in potencialno razširiti njegovo funkcionalnost znotraj aplikacij za urejanje slik.

The source of the article is from the blog toumai.es

Privacy policy
Contact