Revoliucinis Požiūris į Vaizdo Į GIF Konvertavimą: Naujas Įrankis iš „Microsoft Research“

„Microsoft“ tyrimų skyriaus naujausia parengta dirbtinio intelekto (AI) modelo – „Pix2Gif“ – technologija sugeba per kelias sekundes paversti statinį vaizdą į animuotą GIF formatą. Šis inovatyvus įrankis jungia vaizdo įvestį su teksto klausimais, kad būtų galima erdviškai pertvankom originalaus vaizdo savybes, rezultatu gaunant dinamišką ir įdomų GIF kūrinį.

Norint suprasti, kaip veikia šis AI įrankis, tyrėjai rekomenduoja vartotojams vadovauti modelį, teikiant tekstinius klausimus kartu su vaizdo įvestimi. Šis tekstinis nurodymas padeda įrankiui patobulinti vaizdo elementus pagal norimą judėjimą ar efektą.

Gif’o sugeneravimo procesas iš toliau esančio vaizdo trunka apie vieną minutę naudojant dabartinę „Pix2Gif“ versiją. Tačiau svarbu paminėti, kad su greitesniu grafiniu vaizdo procesoriu (GPU) įrankis gali pagaminti GIF’o dar greičiau.

Norint išmokyti šį AI modelį, tyrėjai naudojo platus duomenų rinkinį, kurį sudarė 100 000 animuotų GIF’ų su atitinkamais paaiškinimais. Kadangi iš jų buvo išskirti kadrų iš šių GIF’ų, o paaiškinimai buvo naudojami kaip tekstiniai nurodymai mokymosi procese. Išnaudoti šį įvairų rinkinį leido „Pix2Gif“ įgauti gebėjimą transformuoti vaizdus į animuotus GIF’us, kurie sužavi žiūrovus.

Nors šis AI modelis išlieka pagrinde tyrimų projektu, yra galimybė integravoti jį į esamus „Microsoft“ produktus, tokius kaip „Copilot“, „Designer“ ar „Paint“. Tokia integracija palengvintų animacijos procesą ir leistų vartotojams lengvai taikyti AI paremtus patobulinimus savo vaizdams.

Svarbu paminėti, kad tyrėjai nepaskelbė GIF’ų šaltinio, naudoto mokyti modelį. Jei „Pix2Gif“ taps visapusišku „Microsoft“ produktu, reikalingas bus licencijuotų duomenų įsigijimas mokymui.

Smalsuoliai ir entuziastai dabar gali patirti „Pix2Gif“ galią bandymo aplinkoje. Pasiekę įrankį, vartotojai gali pateikti vaizdą ar tekstinį nurodymą ir pamatyti, kaip jis pavirsta į nuoseklų GIF. Be to, „Microsoft“ planuoja patobulinti įrankio galimybes, galbūt išplatindama jo funkcionalumą vaizdų redagavimo programose.

Dažnai Užduodami Klausiama (DUK)

1. Kas yra „Pix2Gif“?
– „Pix2Gif“ yra „Microsoft“ tyrimų skyriaus sukurtas AI modelis, kuris verčia vis dar stovinčius vaizdus į animuotus GIF’us. Jis naudoja unikalų vaizdų vertimo požiūrį ir leidžia vartotojams pateikti papildomus teksto nurodymus redagavimui.

2. Kaip veikia „Pix2Gif“?
– Vartotojai modeliui vadovauja teikdami tekstą kartu su vaizdo įvestimi. AI algoritmas erdviškai transformuoja originalų vaizdą pagal šį nurodymą, rezultatu būdamas GIF kūrimu.

3. Kiek laiko trunka sugeneruoti GIF’ą su „Pix2Gif“?
– Šiuo metu „Pix2Gif“ trunka apie vieną minutę sugeneruoti 2 sekundžių GIF’ą iš vis dar vaizdo. Tačiau apdorojimo laikas galėtų sumažėti naudojant greitesnį GPU.

4. Kokius duomenis buvo naudota mokyti „Pix2Gif“ modelį?
– Tyrėjai naudojo duomenų rinkinį, sudarytą iš apie 100 000 animuotų GIF’ų su atitinkamais paaiškinimais. Iš šių GIF’ų buvo ištraukti kadrai, o paaiškinimai tarnavo kaip mokymo tekstiniai nurodymai.

5. Ar „Pix2Gif“ bus įtrauktas į „Microsoft“ produktus?
– Nors „Pix2Gif“ šiuo metu yra tyrimų projektas, „Microsoft“ gali svarstyti galimybę jį įtraukti į esamus produktus, tokius kaip „Copilot“, „Designer“ ar „Paint“. Tokia integracija palengvintų animacijos procesą ir būtų siūlomi AI paremti vaizdų patobulinimai.

The source of the article is from the blog macnifico.pt

Privacy policy
Contact