مايكروسوفت ريسيرش آسيا تقدم رسائل متقدمة باستخدام الذكاء الاصطناعي

فريق بحث Microsoft للذكاء الصناعي في آسيا قد قدم قفزة نوعية في ميدان الذكاء الصناعي والرسوم المتحركة. ابتكروا أحدث ابتكار لديهم يتضمن تطبيق ذكاء اصطناعي يحتوي على القدرة الفريدة على تحريك الصور الثابتة بحيث تبدو وكأنها تتحدث أو تغني بجانب مسار صوتي مرافق، مع تعابير وجهية واقعية بشكل مقنع.

نجح الباحثون في إنشاء منصة تحمل اسم VASA-1، التي يمكنها تحريك أي صورة ثابتة – سواء كانت صورة فوتوغرافية أو رسمًا أو حتى لوحة – إلى ما يشير إليهم باسم “تحريك متزامن بشكل ممتاز”. هذا المستوى من الدقة في تزامن حركة الشفتين وتعابير الوجه للشخص الموجود في الصورة مع الصوت ليس له مثيل إذا مقارن بالتقنيات المماثلة التي شاهدناها في الماضي.

على سبيل المثال، قد قدم الفريق هذا النظام من خلال تحريك نسخة كرتونية للموناليزا بشكل راب، وكذلك تحويل صورة امرأة إلى أداء غنائي. بين هذه الأمثلة، يمكن رؤية تغييرات رقيقة في تعابير الوجه، مما يعزز وضوح وتأثير الكلمات المنطوقة.

خلال مرحلة الإنشاء، قام الباحثون بتدريب تطبيقهم على الآلاف من الصور التي تظهر مجموعة متنوعة من تعابير الوجه. تعرض الرسوم المتحركة الناتجة بدقة 512 في 512 بيكسل وتعمل بسلاسة عند 45 إطارًا في الثانية. ويستغرق إنشاء هذه الفيديوهات حوالي دقيقتين، باستخدام معالج الرسوميات Nvidia RTX 4090 عالي الجودة.

استخدامات VASA-1 المحتملة متنوعة، بما في ذلك إنشاء شخصيات افتراضية خيالية لألعاب الفيديو أو المحاكاة. على الرغم من ذلك، يظل الفريق البحثي حذرًا من إمكانية إنشاء محتوى غير مرغوب فيه بواسطة التلاعب بالأختام التكنولوجي. لذا، لم يقوموا بإصدار التقنية للاستخدام العام. تخيل الاحتمالات إذا تم دمج مثل هذه التكنولوجيا مع تطبيقات الفيديو الأخرى التي يديرها الذكاء الاصطناعي مثل سورا من OpenAI.

لمزيد من المعلومات والعروض التوضيحية المفصلة، يمكن للقراء الفضوليين وعشاق التكنولوجيا العثور على معلومات إضافية على الصفحة الرسمية للمشروع التي قدمها الفريق البحثي.

أسئلة وأجوبة مهمة:

س: ما هي التطبيقات المحتملة لتكنولوجيا VASA-1؟
ج: يمكن استخدام VASA-1 لإنشاء شخصيات افتراضية واقعية لألعاب الفيديو أو المحاكاة، تعزيز واجهات المساعدات الافتراضية، إنشاء محتوى ديناميكي للتسويق الرقمي، وإحياء اللقطات التاريخية أو الصور. بالإضافة إلى ذلك، له استخدامات محتملة في صناعة الأفلام والترفيه لإنشاء تأثيرات خاصة أو لأحياء الشخصيات الشهيرة المتوفاة رقميًا.

س: ما هي الاعتبارات الأخلاقية والتحديات المرتبطة بالرسوم المتحركة المتقدمة باستخدام الذكاء الصناعي؟
ج: إحدى القلقات الرئيسية هي خطر إنشاء أختام تكنولوجية وقد يتم استخدامها لإنشاء محتوى مضلل أو خبيث، وانتهاك الخصوصية، وخلق تمثيلات كاذبة للأفراد. قد تتحدى التكنولوجيا أيضًا حقوق الملكية الفكرية وصحة وسلامة الوسائط الرقمية.

التحديات الرئيسية والجدل:

الاستخدام الأخلاقي: يثير تطوير الرسوم المتحركة فائقة الواقعية من خلال الذكاء الاصطناعي أسئلة أخلاقية هامة، خاصة حول القدرة المستمرة والاحتمالية للسوء في إنشاء أختام تكنولوجية.
التنظيم: يوجد حاليًا نقص في التنظيم الشامل الذي يوجه استخدام تطبيقات الذكاء الاصطناعي المتقدمة، مما يمكن أن يؤدي إلى سيناريوهات مثيرة للجدل.
إدراك الجمهور: يمكن أن يؤثر خوف من استخدام التكنولوجيا لنشر معلومات مزيفة على ثقة الجمهور في إمكانيات الذكاء الاصطناعي والتطورات في هذا المجال.

المزايا:

الابتكار: يمثل VASA-1 قفزة هامة في قدرة الذكاء الاصطناعي على إنشاء تمثيلات رقمية ورسوم متحركة واقعية.
السرعة والكفاءة: القدرة على تحريك الصور بسرعة بدقة عالية تحسن عمليات إنشاء المحتوى، مما يوفر الوقت والموارد.
اليسر والوصولية: جلب الشخصيات التاريخية أو الفنية للحياة يمكن أن يجعل التعليم والمحتوى الثقافي أكثر جاذبية ووصولاً.

العيوب:

تهديد الأختام التكنولوجية: يمكن استخدام التكنولوجيا لإنشاء أختام تكنولوجية، مما يشكل تهديدًا لنزاهة المعلومات وخصوصية الأفراد.
فقدان الوظائف: قد يؤدي انتشار الرسوم المتحركة التي يديرها الذكاء الاصطناعي إلى اضطراب الصناعات التي تعتمد على التقاليد في الرسوم المتحركة والنمذجة، مما قد يؤثر على الوظائف.

بالنسبة لأولئك الذين يرغبون في معرفة المزيد حول البحث الذي يقوم به فريق بحث Microsoft، يمكنكم زيارة موقعهم الرئيسي على الويب على Microsoft Research.

The source of the article is from the blog mivalle.net.ar

Privacy policy
Contact