Иновативен подход за създаване на GIF чрез AI модел от Microsoft Research

Отделът за изследвания на Microsoft наскоро представи новаторски изкуствен интелект (AI) модел, способен да превръща статични изображения в анимирани GIF файлове във въпрос на секунди. Този иновативен инструмент, известен като Pix2Gif, използва модел на разпръскване, подобен на другите AI модели за превръщане на текст в видео. Отличителното за Pix2Gif обаче е неговият уникален подход към превода на изображения.

В противоположност на традиционните методи, които се базират само на изображението, Pix2GIF позволява на потребителите да предоставят текстови инструкции за допълнително редактиране след качването на изображението. Чрез съчетаването на текстови и графични подсказки, AI моделът трансформира пространствено характеристиките на оригиналното изображение, което довежда до динамично и завладяващо създаване на GIF.

За да разберете по-добре как работи този инструмент на AI, изследователите препоръчват на потребителите да насочват модела, като предоставят текстова подсказка заедно с изображението. Този текстови указания помага на инструмента да подобри визуалните елементи на изображението въз основа на желанието за движение или ефект.

Процесът на генериране на GIF от неподвижно изображение отнема приблизително една минута при използването на текущата версия на Pix2Gif. Важно е да се посочи, че с по-бърз графичен процесор (GPU), инструмента може да произведе GIF файлове в още по-кратък период от време.

За да обучат AI модела, изследователите използваха голям набор от данни, съдържащ приблизително 100 000 анимирани GIF файлове, обвързани с подходящи наименования. Кадрите бяха извлечени от тези GIF файлове, а заглавията бяха използвани като текстови подсказки по време на обучителния процес. Чрез използването на този разнообразен набор от данни, Pix2Gif се превърна в способен да трансформира изображения в живописни GIF файлове, които пленяват гледащите.

Въпреки че този AI модел все още остава предимно научен проект, съществуват възможности за неговото включване в съществуващите продукти на Microsoft като Copilot, Designer или Paint. Тази интеграция би опростила процеса на анимация и би позволила на потребителите непринудено да прилагат подобрения, задвижвани от AI, към техните изображения.

Важно е да се спомене, че изследователите не са разкрили източниците на GIF файловете, използвани за обучението на модела. В случай че Pix2Gif се развие в напълно разработен продукт на Microsoft, придобиването на лицензирана информация за обучение ще бъде от съществено значение.

Любопитните лица и ентусиасти могат вече да изпитат мощта на Pix2Gif в тества среда. Чрез достъп до инструмента, потребителите могат да изпратят изображение или текстова подсказка и да видят трансформацията му в безупречен GIF файл. Освен това, Microsoft планира да довърши възможностите на инструмента, като по възможност разшири функционалността му в приложенията за редактиране на изображения.

Често задавани въпроси (FAQ)

1. Какво е Pix2Gif?
– Pix2Gif е AI модел, разработен от отдела за изследвания на Microsoft, който превръща неподвижни изображения в анимирани GIF файлове. Той използва уникален подход за транслация на изображения и позволява на потребителите да предоставят допълнителни инструкции за редактиране чрез текст.

2. Как работи Pix2Gif?
– Потребителите насочват модела на Pix2Gif, като предоставят текстова подсказка заедно с въведеното изображение. AI алгоритъмът трансформира оригиналното изображение пространствено въз основа на този съвет, което води до създаването на GIF.

3. Колко време отнема да се създаде GIF чрез Pix2Gif?
– В момента Pix2Gif отнема около една минута, за да генерира 2-секунден GIF от неподвижно изображение. Въпреки това времето за обработка може да се намали дори повече с използването на по-бърз GPU.

4. Какви данни бяха използвани за обучението на модела Pix2Gif?
– Изследователите използваха набор от данни, съдържащ около 100 000 анимирани GIF файлове с отговарящи заглавия. Кадрите бяха извлечени от тези GIF файлове, а заглавията служиха за текстова подсказка по време на обучението.

5. Ще бъде ли включен Pix2Gif в продуктите на Microsoft?
– Въпреки че Pix2Gif е в момента научен проект, Microsoft може да разгледа възможността за интегриране в съществуващи продукти като Copilot, Designer или Paint. Такава интеграция би опростила процеса на анимация и би предложила подобрения към изображенията, задвижвани от изкуствения интелект.

Източници:
– [Microsoft Research](https://www.microsoft.com/en-us/research/)
– [Tom’s Guide](https://www.tomsguide.com/)

The source of the article is from the blog reporterosdelsur.com.mx

Privacy policy
Contact