أداة الذكاء الاصطناعي التجريبية التي أنشأتها Microsoft Research Asia يمكنها إنشاء Deepfakes تشبه الواقعية

تقدم تقدم مايكروسوفت التكنولوجيا في مجال الذكاء الاصطناعي والصورة

أداة الذكاء الاصطناعي الابتكارية التي طورتها Microsoft Research Asia والتي تدعى VASA-1 قد قدمت خطوة هامة في توليد الوسائط الإعلامية عن طريق تحويل الصور الثابتة والأصوات إلى شخصيات متحركة تتحدث. تعمل VASA-1 عن طريق دمج صورة فوتوغرافية أو رسم لشخص مع ملف صوت لإنشاء شخصية افتراضية تبدو وكأنها تتحدث أو تغني بمزامنة مع إدخال الصوت.

تعمل الرؤى التي تم إنشاؤها على محاكاة حركات الإنسان بشكل وثيق، من خلال تقليد تعبيرات الوجه وحركات الرأس بواقعية مذهلة. عند مطابقتها مع ملف صوت مقابل، يقوم الذكاء الاصطناعي بنجاح باقتحام شفاه الموضوع، مما يخلق الوهم بأن الصورة ثنائية الأبعاد أصبحت حية.

على الرغم من النتائج الملحوظة، لاحظ فريق البحث أن بعض التحريكات الروبوتية في حركات الرأس يمكن أن تكشف طبيعة الاصطناع تحت المراقبة الدقيقة. لهذا السبب، ونظرًا للاعتبارات الأخلاقية، يمتنع العلماء عن إطلاق أي عرض تجريبي عام أو واجهة برمجة تطبيقات أو منتج باستخدام VASA-1 حتى يمكن التأكد من تطبيق مسؤول ومنظم.

عبرت المجتمع البحثي عن رفضها لاستخدام هذه التقنية لتوليد محتوى مضلل أو ضار، مؤكدة اهتمامًا قويًا بتستخدام تلك التقدمات لمساعدة في الكشف عن التزوير. إنهم يتصورون مستقبلًا يوفر فيه هذا الأداة ليس فقط الرفاقة والفوائد العلاجية لأولئك الذين في حاجة إليها، ولكن أيضًا يمنح لمسة إنسانية لتفاعلات الذكاء الاصطناعي في مجموعة متنوعة من التطبيقات.

في سياق متصل، اعتزلت Microsoft مؤخرًا نموذجًا للذكاء الاصطناعي يدعى WizardLM-2 يومًا واحدًا فقط بعد إصداره، بعد أن تبين أنه لم يمر باختبار شمولي للسمية، مما يسلط الضوء بشكل إضافي على النهج الحذر الذي تتبعه العمالقة التكنولوجيين في استخدام التطبيقات الذكاء الاصطناعي.

الأسئلة والأجوبة الهامة:

س: ما الذي يجعل VASA-1 مهمًا في مجال توليد الوسائط الإعلامية؟
ج: يمثل VASA-1 خطوة ملحوظة حيث يمكنه توليد رسوم متحركة واقعية لأحرف تتحدث من خلال دمج الصور الثابتة مع إدخالات الصوت. قدرته على تقليد حركات الإنسان وتعابير الوجه بشكل وثيق يقدم احتمالات جديدة في إنشاء أفاتارات ومساعدين افتراضيين حية.

س: ما هي التحديات الرئيسية والجدل المرتبط بها مع VASA-1 وأدوات الذكاء الاصطناعي المماثلة؟
ج: أحد التحديات الرئيسية هو ضمان عدم استخدام هذه الأدوات لأغراض ضارة مثل إنشاء مقاطع الفيديو المزيفة التي يمكن أن تنتشر الأكاذيب وتستخدم لابتزاز أو التنكر للأفراد بدون موافقة. هناك أيضًا مخاوف أخلاقية وخصوصية، حيث يصعب التمييز بين الواقع والوسائط الاصطناعية. ينشب الجدل غالبًا حول الموافقة واستخدام صورة الشخص دون إذن.

التحديات أو الجدل الرئيسي:

الآثار الأخلاقية: استخدام الذكاء الاصطناعي لإنشاء مقاطع الفيديو المتعمقة الحياة يطرح بعض الأسئلة الأخلاقية، بشكل رئيسي حول الموافقة والإشاعات، والخصوصية.
القابلية للتمييز: أصبح من الصعب تمييز المحتوى الحقيقي عن الذكاء الاصطناعي المتقدم، مما قد يكون له تأثيرات كبيرة على الثقة في الوسائط الرقمية.
التنظيم: حاليا لا توجد تنظيمات شاملة تحكم في إنشاء وتوزيع مقاطع الفيديو المزيفة، مما يؤدي إلى احتمال انتهاكات.

المزايا والعيوب:

المزايا:

الترفيه والإبداع: يمكن للفنانين ومنتجي المحتوى استخدام هذه التكنولوجيا لإنتاج أشكال جديدة من الترفيه والتفاعل مع الجماهير بطرق جديدة.
الوصولية: يمكن أن تساعد الرسوم المتحركة الذكاء الاصطناعي في توفير تكنولوجيا مساعدة للأشخاص ذوي الإعاقة أو تقديم الرفاقية لأولئك الذين في حاجة إليها.
الأدوات التعليمية: يمكن استخدام الرسوم المتحركة الحياقية في المحتوى التعليمي لإنشاء تجارب تعلم أكثر إشراكا.

العيوب:

الخداع: يمكن استخدام مقاطع الفيديو المتعمقة الحياة التي تم إنشاؤها بواسطة الذكاء الاصطناعي لخداع الجمهور، ونشر المعلومات الخاطئة، أو إنشاء محتوى مزور.
مخاوف الخصوصية: بدون تنظيم سليم، يمكن أن يؤدي سوء استخدام الصور الشخصية إلى انتهاك حقوق الأفراد في الخصوصية.
العواقب القانونية: مع تطور التكنولوجيا، سيكون هناك حاجة لقوانين جديدة لمعالجة الإمكانية الناتجة عن الضرر.

لمزيد من المعلومات حول التقدمات وتطبيقات الذكاء الاصطناعي، يمكنك زيارة موقع بحوث مايكروسوفت الرئيسي: Microsoft Research.

The source of the article is from the blog bitperfect.pe

Privacy policy
Contact