نوآوری هوش مصنوعی Adobe Research جلوهی صفحه وضوح ویدئو را بهبود میبخشد – مهندسان در Adobe Research یک برنامه پیشروی هوش مصنوعی به نام VideoGigaGAN معرفی کردهاند. این ابزار هوش مصنوعی طراحی شده است تا نمونههای ویدئوی مبهم را به نسخههای بسیار واضحتر تبدیل کند، با ارائه وضوح به طرز چشمگیری بعد از پردازش.
این تیم از یک شبکه مبارزهای ژنراتیو (GAN) با هدف خاص آموزش سیستم به منظور شناخت وضوح و روشنایی محتوای ویدئو با کیفیت بالا استفاده کردهاند – آنها بر روی جزئیات پیچیده تمرکز کردهاند، مانند موهای جداگانه ابرو، به جای یک جریان مبهم.
تضمین همسانی فریمهای ویدئو با هوش مصنوعی پیشرفته – برای حفظ کیفیت یکسان در فریمهای ویدئو، محققان Adobe یک “ماژول انتقال راهنمایی جریان” را یکپارچه کردند که حیاتی برای پیوستگی داستان بصری ویدئو است.
مقایسه بین روش ادوبی، که با برچسب “ما” مشخص شده است و روشهای دیگر نشان میدهد که علمای این شرکت به چه رویهای دست زدهاند. مقاله آنها در پلتفرم arXiv قابل دسترس است.
نحوه بهبود کیفیت ویدئو توسط شبکههای مبارزهی ژنراتیو – شبکههای مبارزهی ژنراتیو از دو شبکه عصبی – یک مولفه و یک تشخیصدهنده – تشکیل شدهاند که در یک رقابت یادگیری شرکت میکنند. نقش مولفه این است که “تقلب” تشخص دهنده را به اشتباه وادار به اشتباه گرفتن دادههای سنتی برای دادههای واقعی کند و تشخص دهنده بهبود بخشیدن به توانایی خود در تمیزی بین این دو است.
برای کاهش خطاهای هوش مصنوعی و برطرف کردن کاهشهای شدید در کیفیت ویدئو، پژوهشگران نیز به روشهای شیارهای و ریزجزئیات پرفرکانس “مسیردهی” کردهاند.
به گفته پژوهشگران، این سیستم قابلیت بهبود کیفیت ویدئو تا هشت برابر را دارد. مهم این است که این ارتقا بدون اینکه مشکلات معمولی مانند رنگهای غیرطبیعی یا خطوط خرده مربوط به پردازش ویدئو توسط هوش مصنوعی معمولاً در نظر گرفته شود، بهبود می یابد.
تعریف مجدد بافتهای ویدئویی واقعگرایانه با هوش مصنوعی – توسعهدهندگان پذیرفتهاند که یک قسمت از ویدئوی نتیجه بهطور کامل توسط VideoGigaGAN عبور شده است مبتنی بر ارزیابی سیستم. هوش مصنوعی میتواند عناصر لازم را مانند منافذ روی پوست، ںارِههای اطراف چشمها یا حتی مژهها به منظور دستیابی به وضوح بالا “کشیده” کند.
هنوز مشخص نیست که آیا ادوبی این برنامه را برای استفاده عموم منتشر خواهد کرد.
قبلاً، ادوبی یک شبکه عصبی برای ایجاد موسیقی با نام Project Music GenAI Control معرفی کرده است که اجازه تولید صدا براساس توصیفهای متنی را میدهد.
پرسشها و پاسخهای مهم:
1. VideoGigaGAN دقیقاً چه کاری انجام میدهد؟
VideoGigaGAN ابزاری با هوش مصنوعی است که توسط Adobe Research توسعه یافته است و وضوح فیلمهای مبهم را افزایش میدهد. از یک شبکه مبارزهی ژنراتیو (GAN) برای تیز نمودن جزئیات در ویدئوها استفاده میکند، با احتمال بهبود کیفیت ویدئو تا هشت برابر.
2. چگونه VideoGigaGAN از همسانی در فریمهای ویدئو اطمینان حاصل میکند؟
محققان Adobe یک ماژول انتقال راهگشایی جریان را پیاده کردند تا از کیفیت یکسان هر فریم از یک ویدئو اطمینان حاصل شود و از این روی ادامه داستان بصری ویدئو حفظ میشود.
3. شبکههای مبارزهی ژنراتیو چیستند و چگونه در این زمینه کار میکنند؟
GANs از دو شبکه عصبی – مولفه و تشخصدهنده – تشکیل شدهاند که در واقع ‘رقابت’ با یکدیگر دارند. در VideoGigaGAN، مولفه فریمهای بهبودیافته ایجاد میکند، در حالی که تشخص دهنده آنها را در مقابل دادههای ویدئوی واقعی بالا کیفیت ارزیابی میکند. هدف اصلی اصلاح کیفیت ویدئو بدون مشکلاتی است که معمولاً به پردازش ویدئوهای بهبود یافته توسط هوش مصنوعی مربوط میشوند.
چالشها و اتفاقات مهم:
اصالت و ملاحظات اخلاقی: نگرانیها درباره اینکه ابزارهای هوش مصنوعی مانند VideoGigaGAN چگونه ممکن است برای ایجاد deepfakes یا تغییر محتوای ویدئو به نحوی گمراهکننده استفاده شود وجود دارد. دستیابی به تعادل بین افزایش کیفیت ویدئو و اطمینان از باقیماندن محتوا واقعی یک چالش اخلاقی پیوسته در زمینه رسانههای مدیریتشده توسط هوش مصنوعی است.
دسترسی و ادغام: سوال برقرار است که چگونه و هنگامی که ادوبی VideoGigaGAN را برای عموم قابل دسترس میکند. ادغام آن در پلتفرمهای ویرایش ویدئویی مانند Adobe Premiere Pro واقعی به نظر میرسد، اما برنامههای خاصی اعلام نشده است.
نیازهای محاسباتی: شبکههای GAN به وجود مصرف بالای محاسبه شناخته شدهاند. دسترسی به سختافزاری پرقدرت ممکن است برای حرفهایها ضروری باشد تا بتوانند VideoGigaGAN را به طور موثر مورد استفاده قرار دهند که میتواند دسترسیپذیری آن را برای گروه هدف گستردهتر محدود کند.
مزایا و معایب:
مزایا:
– امکان بهبود وضوح ویدئو برای حرفهایان در صنعت فیلم، تلویزیون و ایجاد محتوا ظاهراً ارزشمند است.
– کاربران میتوانند فیلمهای کهنه یا فرسوده را بازیابی کنند که میتواند به دنباله های محتوای تاریخی یا شخصی ارزشمند کمک کند.
– این تکنولوژی میتواند در بازسازی و ریمستر کردن ویدئو برای تجربه مصرفکننده بهبود بخشد.
معایب:
– ممکن است خطر وابستگی بیش از حد به هوش مصنوعی برای پردازش تصویر و ویدئو وجود داشته باشد که ممکن است مهارتهای سنتی ساخت فیلم را نادیده گرفته شود.
– باید دقت شود تا از سوءاستفاده از فناوری در ایجاد محتوای گمراه کننده یا تقلبی پرهیز شود.
– هزینه بالای ممکن یا قدرت محاسباتی لازم برای استفاده از ابزارهای هوش مصنوعی پیشرفته میتواند برای برخی کاربران ممانعتزا باشد.
برای اطلاعات مرتبط لطفا به دامنهی اصلی Adobe Research از طریق لینک زیر مراجعه فرمایید:
انجام محققان Adobe