راه‌اندازی ابزار هوش مصنوعی جدید Microsoft Research برای تبدیل تصاویر به GIF

بخش تحقیقاتی شرکت مایکروسافت به تازگی مدلی نوآورانه به نام Pix2Gif را رونمایی کرده است که توانایی تبدیل تصاویر استاتیک به GIF‌های متحرک را در عداد ثانیه دارد. این ابزار نوآورانه از مدل انتشار مانند دیگر مدل‌های هوش مصنوعی متن به ویدیو استفاده می‌کند. با این وجود، آنچه که Pix2Gif را منحصر به فرد می‌کند، رویکرد یکتای آن در ترجمه تصاویر است.

بر خلاف روش‌های سنتی که به صورت کامل از ورودی تصویر استفاده می‌کنند، Pix2Gif به کاربران اجازه می‌دهد پس از آپلود تصویر، دستورات متنی بیشتری برای ویرایش‌های بعدی بدهند. با ترکیب همزمان هر دو آزمون تصویر و متن، مدل هوش مصنوعی ویژگی‌های تصویر اصلی را در فضایی تبدیل می‌کند و نتیجه‌اش ایجاد یک GIF پویا و جذاب است.

برای بهتر درک نحوه کار این ابزار هوش مصنوعی، پژوهشگران توصیه می‌کنند که کاربران مدل را با ارائه دستور متنی پشتیبانی کنند همراه با ورودی تصویر. این راهنمایی متنی به ابزار کمک می‌کند تا عناصر بصری تصویر بر اساس حرکت یا اثر مورد نظر بهبود یابد.

فرایند ایجاد یک GIF از یک تصویر ثابت با استفاده از نسخه کنونی Pix2Gif، تقریباً یک دقیقه زمان می‌برد. با این حال، ارزش ذکر دارد که با استفاده از یک واحد پردازش گرافیکی (GPU) سریعتر، این ابزار ممکن است در مدت زمان کمتری GIF تولید کند.

برای آموزش مدل هوش مصنوعی، پژوهشگران از مجموعه داده‌ای بزرگ شامل ۱۰۰ هزار GIF متحرک به همراه عنوان‌های مربوطه استفاده کرده‌اند. فریم‌ها از این GIF‌ها برداشته شد و عناوین به عنوان دستور متنی آموزشی در فرآیند آموزش مورد استفاده قرار گرفت. با بهره‌گیری از این مجموعه گسترده، Pix2Gif توانایی تبدیل تصاویر به GIF‌های جذابی که تماشایی هستند را فراهم کرده است.

هرچند که این مدل هوش مصنوعی اصلیاً یک پروژه تحقیقاتی است، اما احتمال وارد شدن آن به محصولات موجود مایکروسافت مانند Copilot، Designer یا Paint وجود دارد. این ادغام امکان می‌دهد فرایند انیمیشن‌سازی را ساده‌تر کرده و به کاربران امکان بهبود‌های راندشوار مبتنی بر هوش مصنوعی را به تصاویر خود بدهد.

ضروری است که بگوییم پژوهشگران منبع GIF‌های استفاده شده برای آموزش مدل را فاش نکرده‌اند. در صورتی که Pix2Gif به یک محصول کاملاً مجازی از مایکروسافت تبدیل شود، تهیه داده‌های مجوزی برای آموزش ضروری خواهد بود.

افراد کنجکاو و طرفداران می‌توانند در حال حاضر قدرت Pix2Gif را در یک محیط آزمایشی تجربه کنند. با دسترسی به این ابزار، کاربران می‌توانند یک تصویر یا دستور متنی ارسال کنند و تبدیل آن به یک GIF بی‌درز را مشاهده کنند. علاوه بر این، مایکروسافت قصد دارد قابلیت‌های ابزار را بهبود بخشد و احتمالاً عملکرد آن را در دامنه برنامه‌های ویرایش تصویر گسترش دهد.

پرسش‌های متداول (FAQ)

1. چیست Pix2Gif؟
– Pix2Gif یک مدل هوش مصنوعی است که توسط بخش تحقیقاتی مایکروسافت توسعه یافته است و تصاویر ثابت را به GIF‌های متحرک تبدیل می‌کند. این ابزار از یک رویکرد ترجمه تصویری یکتا استفاده می‌کند و به کاربران اجازه می‌دهد دستورات متنی اضافی برای ویرایش ارائه دهند.

2. چطور Pix2Gif کار می‌کند؟
– کاربران مدل Pix2Gif را با ارائه دستور متنی به همراه ورودی تصویر هدایت می‌کنند. الگوریتم‌های هوش مصنوعی بر اساس این راهنمایی تصویر اصلی را مکانیکی تبدیل می‌کند، که در نهایت به ایجاد یک GIF منجر می‌شود.

3. چه مدت زمانی برای ایجاد یک GIF با Pix2Gif نیاز است؟
– در حال حاضر، Pix2Gif حدود یک دقیقه زمان لازم برای تولید یک GIF 2 ثانیه‌ای از یک تصویر ثابت است. با این حال، با استفاده از یک GPU سریعتر، زمان پردازش ممکن است کمتر شود.

4. چه داده‌هایی برای آموزش مدل Pix2Gif استفاده شد؟
– پژوهشگران از مجموعه داده حاوی حدود 100 هزار GIF متحرک همراه با عناوین مربوطه برای آموزش مدل Pix2Gif استفاده کردند. فریم‌ها از این GIF‌ها برداشته شد و عناوین به عنوان دستور متنی آموزشی استفاده شدند.

5. آیا Pix2Gif به محصولات مایکروسافت اضافه خواهد شد؟
– با اینکه Pix2Gif در حال حاضر یک پروژه تحقیقاتی است، اما امکان ادغام آن در محصولات موجود مایکروسافت مانند Copilot، Designer یا Paint وجود دارد. چنین ادغامی فرآیند انیمیشن‌سازی را ساده‌تر خواهد کرد و به کاربران امکان بهبود‌های تصویری راندشوار مبتنی بر هوش مصنوعی را ارائه خواهد داد.

منابع:
– [Microsoft Research](https://www.microsoft.com/en-us/research/)
– [Tom’s Guide](https://www.tomsguide.com/)

The source of the article is from the blog tvbzorg.com

Privacy policy
Contact