مهندسان تحقیقات Adobe نرم‌افزار افزایش ویدیویی هوش مصنوعی را توسعه می‌دهند

نوآوری هوش مصنوعی Adobe Research جلوه‌ی صفحه وضوح ویدئو را بهبود می‌بخشد – مهندسان در Adobe Research یک برنامه پیش‌روی هوش مصنوعی به نام VideoGigaGAN معرفی کرده‌اند. این ابزار هوش مصنوعی طراحی شده است تا نمونه‌های ویدئوی مبهم را به نسخه‌های بسیار واضح‌تر تبدیل کند، با ارائه وضوح به طرز چشم‌گیری بعد از پردازش.

این تیم از یک شبکه مبارزه‌ای ژنراتیو (GAN) با هدف خاص آموزش سیستم به منظور شناخت وضوح و روشنایی محتوای ویدئو با کیفیت بالا استفاده کرده‌اند – آن‌ها بر روی جزئیات پیچیده تمرکز کرده‌اند، مانند موهای جداگانه ابرو، به جای یک جریان مبهم.

تضمین همسانی فریم‌های ویدئو با هوش مصنوعی پیشرفته – برای حفظ کیفیت یکسان در فریم‌های ویدئو، محققان Adobe یک “ماژول انتقال راهنمایی جریان” را یکپارچه کردند که حیاتی برای پیوستگی داستان بصری ویدئو است.

مقایسه بین روش ادوبی، که با برچسب “ما” مشخص شده است و روش‌های دیگر نشان می‌دهد که علمای این شرکت به چه رویه‌ای دست زده‌اند. مقاله آن‌ها در پلتفرم arXiv قابل دسترس است.

نحوه بهبود کیفیت ویدئو توسط شبکه‌های مبارزهی ژنراتیو – شبکه‌های مبارزهی ژنراتیو از دو شبکه عصبی – یک مولفه و یک تشخیص‌دهنده – تشکیل شده‌اند که در یک رقابت یادگیری شرکت می‌کنند. نقش مولفه این است که “تقلب” تشخص دهنده را به اشتباه وادار به اشتباه گرفتن داده‌های سنتی برای داده‌های واقعی کند و تشخص دهنده بهبود بخشیدن به توانایی خود در تمیزی بین این دو است.

برای کاهش خطاهای هوش مصنوعی و برطرف کردن کاهش‌های شدید در کیفیت ویدئو، پژوهشگران نیز به روش‌های شیارهای و ریزجزئیات پرفرکانس “مسیردهی” کرده‌اند.

به گفته پژوهشگران، این سیستم قابلیت بهبود کیفیت ویدئو تا هشت برابر را دارد. مهم این است که این ارتقا بدون اینکه مشکلات معمولی مانند رنگ‌های غیرطبیعی یا خطوط خرده مربوط به پردازش ویدئو توسط هوش مصنوعی معمولاً در نظر گرفته شود، بهبود می یابد.

تعریف مجدد بافت‌های ویدئویی واقع‌گرایانه با هوش مصنوعی – توسعه‌دهندگان پذیرفته‌اند که یک قسمت از ویدئوی نتیجه به‌طور کامل توسط VideoGigaGAN عبور شده است مبتنی بر ارزیابی سیستم. هوش مصنوعی می‌تواند عناصر لازم را مانند منافذ روی پوست، ںارِه‌های اطراف چشم‌ها یا حتی مژه‌ها به منظور دستیابی به وضوح بالا “کشیده” کند.

هنوز مشخص نیست که آیا ادوبی این برنامه را برای استفاده عموم منتشر خواهد کرد.

قبلاً، ادوبی یک شبکه عصبی برای ایجاد موسیقی با نام Project Music GenAI Control معرفی کرده است که اجازه تولید صدا براساس توصیف‌های متنی را می‌دهد.

پرسش‌ها و پاسخ‌های مهم:

1. VideoGigaGAN دقیقاً چه کاری انجام می‌دهد؟
VideoGigaGAN ابزاری با هوش مصنوعی است که توسط Adobe Research توسعه یافته است و وضوح فیلم‌های مبهم را افزایش می‌دهد. از یک شبکه مبارزهی ژنراتیو (GAN) برای تیز نمودن جزئیات در ویدئوها استفاده می‌کند، با احتمال بهبود کیفیت ویدئو تا هشت برابر.

2. چگونه VideoGigaGAN از همسانی در فریم‌های ویدئو اطمینان حاصل می‌کند؟
محققان Adobe یک ماژول انتقال راهگشایی جریان را پیاده کردند تا از کیفیت یکسان هر فریم از یک ویدئو اطمینان حاصل شود و از این روی ادامه داستان بصری ویدئو حفظ می‌شود.

3. شبکه‌های مبارزهی ژنراتیو چیستند و چگونه در این زمینه کار می‌کنند؟
GANs از دو شبکه عصبی – مولفه و تشخص‌دهنده – تشکیل شده‌اند که در واقع ‘رقابت’ با یکدیگر دارند. در VideoGigaGAN، مولفه فریم‌های بهبودیافته ایجاد می‌کند، در حالی که تشخص دهنده آن‌ها را در مقابل داده‌های ویدئوی واقعی بالا کیفیت ارزیابی می‌کند. هدف اصلی اصلاح کیفیت ویدئو بدون مشکلاتی است که معمولاً به پردازش ویدئوهای بهبود یافته توسط هوش مصنوعی مربوط می‌شوند.

چالش‌ها و اتفاقات مهم:

اصالت و ملاحظات اخلاقی: نگرانی‌ها درباره اینکه ابزارهای هوش مصنوعی مانند VideoGigaGAN چگونه ممکن است برای ایجاد deepfakes یا تغییر محتوای ویدئو به نحوی گمراه‌کننده استفاده شود وجود دارد. دستیابی به تعادل بین افزایش کیفیت ویدئو و اطمینان از باقی‌ماندن محتوا واقعی یک چالش اخلاقی پیوسته در زمینه رسانه‌های مدیریت‌شده توسط هوش مصنوعی است.

دسترسی و ادغام: سوال برقرار است که چگونه و هنگامی که ادوبی VideoGigaGAN را برای عموم قابل دسترس می‌کند. ادغام آن در پلتفرم‌های ویرایش ویدئویی مانند Adobe Premiere Pro واقعی به نظر می‌رسد، اما برنامه‌های خاصی اعلام نشده است.

نیازهای محاسباتی: شبکه‌های GAN به وجود مصرف بالای محاسبه شناخته شده‌اند. دسترسی به سخت‌افزاری پرقدرت ممکن است برای حرفه‌ای‌ها ضروری باشد تا بتوانند VideoGigaGAN را به طور موثر مورد استفاده قرار دهند که می‌تواند دسترسی‌پذیری آن را برای گروه هدف گسترده‌تر محدود کند.

مزایا و معایب:

مزایا:
– امکان بهبود وضوح ویدئو برای حرفه‌ایان در صنعت فیلم، تلویزیون و ایجاد محتوا ظاهراً ارزشمند است.
– کاربران می‌توانند فیلم‌های کهنه یا فرسوده را بازیابی کنند که می‌تواند به دنباله های محتوای تاریخی یا شخصی ارزشمند کمک کند.
– این تکنولوژی می‌تواند در بازسازی و ریمستر کردن ویدئو برای تجربه مصرف‌کننده بهبود بخشد.

معایب:
– ممکن است خطر وابستگی بیش از حد به هوش مصنوعی برای پردازش تصویر و ویدئو وجود داشته باشد که ممکن است مهارت‌های سنتی ساخت فیلم را نادیده گرفته شود.
– باید دقت شود تا از سوءاستفاده از فناوری در ایجاد محتوای گمراه کننده یا تقلبی پرهیز شود.
– هزینه بالای ممکن یا قدرت محاسباتی لازم برای استفاده از ابزارهای هوش مصنوعی پیشرفته می‌تواند برای برخی کاربران ممانعت‌زا باشد.

برای اطلاعات مرتبط لطفا به دامنه‌ی اصلی Adobe Research از طریق لینک زیر مراجعه فرمایید:
انجام محققان Adobe