بخش تحقیقاتی شرکت مایکروسافت به تازگی مدلی نوآورانه به نام Pix2Gif را رونمایی کرده است که توانایی تبدیل تصاویر استاتیک به GIFهای متحرک را در عداد ثانیه دارد. این ابزار نوآورانه از مدل انتشار مانند دیگر مدلهای هوش مصنوعی متن به ویدیو استفاده میکند. با این وجود، آنچه که Pix2Gif را منحصر به فرد میکند، رویکرد یکتای آن در ترجمه تصاویر است.
بر خلاف روشهای سنتی که به صورت کامل از ورودی تصویر استفاده میکنند، Pix2Gif به کاربران اجازه میدهد پس از آپلود تصویر، دستورات متنی بیشتری برای ویرایشهای بعدی بدهند. با ترکیب همزمان هر دو آزمون تصویر و متن، مدل هوش مصنوعی ویژگیهای تصویر اصلی را در فضایی تبدیل میکند و نتیجهاش ایجاد یک GIF پویا و جذاب است.
برای بهتر درک نحوه کار این ابزار هوش مصنوعی، پژوهشگران توصیه میکنند که کاربران مدل را با ارائه دستور متنی پشتیبانی کنند همراه با ورودی تصویر. این راهنمایی متنی به ابزار کمک میکند تا عناصر بصری تصویر بر اساس حرکت یا اثر مورد نظر بهبود یابد.
فرایند ایجاد یک GIF از یک تصویر ثابت با استفاده از نسخه کنونی Pix2Gif، تقریباً یک دقیقه زمان میبرد. با این حال، ارزش ذکر دارد که با استفاده از یک واحد پردازش گرافیکی (GPU) سریعتر، این ابزار ممکن است در مدت زمان کمتری GIF تولید کند.
برای آموزش مدل هوش مصنوعی، پژوهشگران از مجموعه دادهای بزرگ شامل ۱۰۰ هزار GIF متحرک به همراه عنوانهای مربوطه استفاده کردهاند. فریمها از این GIFها برداشته شد و عناوین به عنوان دستور متنی آموزشی در فرآیند آموزش مورد استفاده قرار گرفت. با بهرهگیری از این مجموعه گسترده، Pix2Gif توانایی تبدیل تصاویر به GIFهای جذابی که تماشایی هستند را فراهم کرده است.
هرچند که این مدل هوش مصنوعی اصلیاً یک پروژه تحقیقاتی است، اما احتمال وارد شدن آن به محصولات موجود مایکروسافت مانند Copilot، Designer یا Paint وجود دارد. این ادغام امکان میدهد فرایند انیمیشنسازی را سادهتر کرده و به کاربران امکان بهبودهای راندشوار مبتنی بر هوش مصنوعی را به تصاویر خود بدهد.
ضروری است که بگوییم پژوهشگران منبع GIFهای استفاده شده برای آموزش مدل را فاش نکردهاند. در صورتی که Pix2Gif به یک محصول کاملاً مجازی از مایکروسافت تبدیل شود، تهیه دادههای مجوزی برای آموزش ضروری خواهد بود.
افراد کنجکاو و طرفداران میتوانند در حال حاضر قدرت Pix2Gif را در یک محیط آزمایشی تجربه کنند. با دسترسی به این ابزار، کاربران میتوانند یک تصویر یا دستور متنی ارسال کنند و تبدیل آن به یک GIF بیدرز را مشاهده کنند. علاوه بر این، مایکروسافت قصد دارد قابلیتهای ابزار را بهبود بخشد و احتمالاً عملکرد آن را در دامنه برنامههای ویرایش تصویر گسترش دهد.
پرسشهای متداول (FAQ)
1. چیست Pix2Gif؟
– Pix2Gif یک مدل هوش مصنوعی است که توسط بخش تحقیقاتی مایکروسافت توسعه یافته است و تصاویر ثابت را به GIFهای متحرک تبدیل میکند. این ابزار از یک رویکرد ترجمه تصویری یکتا استفاده میکند و به کاربران اجازه میدهد دستورات متنی اضافی برای ویرایش ارائه دهند.
2. چطور Pix2Gif کار میکند؟
– کاربران مدل Pix2Gif را با ارائه دستور متنی به همراه ورودی تصویر هدایت میکنند. الگوریتمهای هوش مصنوعی بر اساس این راهنمایی تصویر اصلی را مکانیکی تبدیل میکند، که در نهایت به ایجاد یک GIF منجر میشود.
3. چه مدت زمانی برای ایجاد یک GIF با Pix2Gif نیاز است؟
– در حال حاضر، Pix2Gif حدود یک دقیقه زمان لازم برای تولید یک GIF 2 ثانیهای از یک تصویر ثابت است. با این حال، با استفاده از یک GPU سریعتر، زمان پردازش ممکن است کمتر شود.
4. چه دادههایی برای آموزش مدل Pix2Gif استفاده شد؟
– پژوهشگران از مجموعه داده حاوی حدود 100 هزار GIF متحرک همراه با عناوین مربوطه برای آموزش مدل Pix2Gif استفاده کردند. فریمها از این GIFها برداشته شد و عناوین به عنوان دستور متنی آموزشی استفاده شدند.
5. آیا Pix2Gif به محصولات مایکروسافت اضافه خواهد شد؟
– با اینکه Pix2Gif در حال حاضر یک پروژه تحقیقاتی است، اما امکان ادغام آن در محصولات موجود مایکروسافت مانند Copilot، Designer یا Paint وجود دارد. چنین ادغامی فرآیند انیمیشنسازی را سادهتر خواهد کرد و به کاربران امکان بهبودهای تصویری راندشوار مبتنی بر هوش مصنوعی را ارائه خواهد داد.
منابع:
– [Microsoft Research](https://www.microsoft.com/en-us/research/)
– [Tom’s Guide](https://www.tomsguide.com/)
The source of the article is from the blog tvbzorg.com