استخدام OpenAI لبيانات يوتيوب لتدريب نموذج الذكاء الاصطناعي GPT-4

تقوم شركة OpenAI، الشركة الرائدة وراء ChatGPT، بالاستفادة من أكثر من مليون ساعة من مقاطع فيديو يوتيوب لتدريب آخر نموذج لها للذكاء الاصطناعي، GPT-4. من خلال استغلال مجموعة واسعة من المصادر ودمج البيانات العامة والشراكات، تهدف OpenAI إلى الحفاظ على تنافسها في مجال البحث العالمي في مجال الذكاء الاصطناعي.

لعب الرئيس التنفيذي لشركة OpenAI، غريغ بروكمان، دورًا حاسمًا في اختيار هذه الفيديوهات للتدريب. بدلاً من التحاشي من الآثار القانونية المحتملة، تعتبر OpenAI استخدامها لمحتوى يوتيوب على أنه استخدام عادل.

بالرد على هذا الكشف، أقرت شركة Google، المالكة ليوتيوب، أن هناك تقارير غير مؤكدة بشأن إجراءات OpenAI. يؤكدون أن ملفات robots.txt وشروط الخدمة تحظر بشكل صارم أي خبط أو تحميل غير مرخص لمحتوى يوتيوب.

بشكل مثير للاهتمام، هذه ليست المرة الأولى التي يتم فيها استخدام بيانات يوتيوب لتدريب نماذج الذكاء الاصطناعي. عملت مايكروسوفت، بالتعاون مع The Information، على استخدام بيانات يوتيوب لهذا الغرض نفسه العام الماضي.

يُعرف يوتيوب بمستودعه الهائل من محتوى وسائط متعددة بما في ذلك الصوت والصور ونصوص الحوار. هذا الثروة من البيانات يجعله موردًا لا يقدر بثمن لتدريب نماذج الذكاء الاصطناعي. ومع ذلك، تثير ممارسة جمع بيانات يوتيوب بشكل كبير مخاوف بشأن الآثار القانونية والأخلاقية، خاصة فيما يتعلق باستخدام البيانات وحقوق الملكية الفكرية.

تُشير OpenAI إلى أن استخدامها يندرج ضمن مبدأ الاستخدام العادل، ولكن جمع بيانات ضخمة غير مرخصة من يوتيوب يثير تساؤلات حول التشريعات الخاصة بحقوق النشر والملكية والموافقة.

نظرًا لاعتماد OpenAI بشكل كبير على بيانات يوتيوب، يصبح من الواضح أن الإرشادات والرقابة الأكثر وضوحًا ضرورية لتناول استخدام البيانات في البحث والتطوير في مجال الذكاء الاصطناعي. التعاون بين مطوري الذكاء الاصطناعي وأصحاب المنصات ومنتجي المحتوى أمر حاسم في وضع إرشادات تحقق التوازن بين الابتكار وحماية الخصوصية وحقوق الملكية الفكرية.

الأسئلة الشائعة

The source of the article is from the blog foodnext.nl

Privacy policy
Contact