یک تحقیق مهم از Technology News، یک آشفتگی جدید را در زمینه توسعه هوش مصنوعی به روشنی آورده است. غولهای صنعت اقدام به استفاده از مدلهای هوش مصنوعی خود که بر اساس مجموعهدادهای تشکیل شده از بیش از ۱۷۳،۰۰۰ کلیپ ویدیویی یوتیوب بدون رضایت کاربران کردهاند.
مجموعهداده، به سرپرستی سازمان غیرانتفاعی EleutherAI بوده و شامل قسمتهایی از ویدیوهای یوتیوب از بیش از ۴۸٬۰۰۰ کانال مختلف است که شرکتهایی چون اپل، انویدیا و آنتروپیک از آن بهره بردهاند. این موضوع نوری بر واقعیت ناراحتکننده این است که فناوری هوش مصنوعی از دادههایی که از محتویسازان بدون رضایت و یا کرایه آنها به دست میآورد، به شدت وابسته است.
برخلاف محتوای اصلی، مجموعهداده شامل هیچ کلیپ ویدیویی واقعی نمیباشد، بلکه اطلاعات متنی از خالقان برتر پلتفرمهایی چون مارکوس براونلی و مستربیست همراه با ناشران خبری بزرگی چون The New York Times، BBC و ABC News است. توصیفهایی از کلیپهای ویدیویی انگجت هم به این مجموعهداده افزوده شده است که به یک چالش اخلاقی خود را در منظر هوش مصنوعی میبرد.
گزارش شده است که اپل اطلاعات هوش مصنوعی را از منابع مختلف بهجمله یک استحصال اطلاعات از کلیپهای ویدیویی یوتیوب به دست میآورد که این روش مشکلات اخلاقی ایجاد میکند. در پی این آشفتگی، شرکتهایی چون اپل و انویدیا به درخواستهای نظری خود بیپاسخ ماندهاند و این نشانگر عدم شفافیت درباره دادههایی که برای آموزش مدلهای هوش مصنوعی استفاده میکنند میباشد.
یوتیوب بهعنوان یک انبار عظیم از محتوای ویدیویی به صورت جهانی برای آموزش مدلهای هوش مصنوعی ایستاده است و به عنوان یک زرگرانگی مرغوب برای این کار شناخته میشود، که محدود به دادههای متنی نیست بلکه تا صدا، ویدیو و تصاویر نیز میرود. مباحث اخلاقی اطراف استفاده از دادههای یوتیوب برای آموزش مدلهای هوش مصنوعی دائماً در حال تشدید است و بر اهمیت شفافیت و رضایت در این منظره فناورانه دنیایی تاکید میشود.
ابعاد جدید در بحثهای اخلاقی در مورد آموزش هوش مصنوعی
در بحثهای مداوم مرتبط با آموزش مدلهای هوش مصنوعی، فاش شدن تحقیقات بیشتر به روشنی نکتههای حیاتی را که نیازمند توجه و بررسی هستند برجای گذاشته است.
یکی از سوالات کلیدی که پیش میآید، مربوط به اندازهای است که خالقان محتوا باید کنترلی روی مواد خود داشته باشند زمانی که برای آموزش هوش مصنوعی استفاده میشود. آیا باید توافقات رسمی یا ساختارهای کرایهدهی تعیین شود تا استفاده منصفانه از دادهها تضمین شود، به ویژه زمانی که از پلتفرمهایی چون یوتیوب نیازمندیم؟
سوال مهم دیگری در ارتباط با شفافیتی که توسط نهادهای صنعتی حفظ شده است زمانی که بازبینی داده برای آموزش هوش مصنوعی انجام میشود بحرانی است. چگونه شرکتهایی چون اپل و انویدیا میتوانند ارتباطات و فرآیندهای افشا را ارتقا دهند تا مسائل اخلاقی را پوشش دهند و با هر دو کاربران و خالقان محتوا اعتماد حفظ کنند؟
یکی از چالشهای اساسی مرتبط با استفاده از مجموعهدادههای بزرگ از پلتفرمهایی چون یوتیوب، نقض حقوق مالکیت فکری است. دغدغه اخلاقی آن زمانی پیدا میشود که مدلهای هوش مصنوعی بدون رضایت صریح بر دادهها آموزش داده شوند و مسائلی مانند حقوق حفظ حریم شخصی، حق تکثیر و حقوق مالکیت پیش بیایند.
مزایای بهرهبرداری از انبارهای وسیع مانند یوتیوب برای آموزش هوش مصنوعی شامل دسترسی به دادههای متنوع و گستردهای است که میتواند عملکرد و قابلیتهای مدلهای هوش مصنوعی را افزایش دهد. اما این مزیت با اختلافات مربوط به ابعاد اخلاقی و نیاز به چارچوبهای اخلاقی سختگیرانه برای هدایت استفاده مسئولانه از چنین دادههایی مقابله میشود.
آشفتگیهای مرتبط با استفاده از کلیپهای ویدیویی یوتیوب برای آموزش هوش مصنوعی نیاز به تعیین رهنمودهای واضح، دریافت رضایت و اطمینان از مسئولیتپذیری در فرآیند توسعه هوش مصنوعی را برجسته سازد. با پیشرفتهای فناوری که به ترقیهایی منجر شده است، امری ضروری است که به دقت در مورد ملاحظات اخلاقی پاسخ دهیم.
برای درک بیشتر از ابعاد اخلاقی آموزش هوش مصنوعی و استفاده از دادهها، میتوانید مقالات Technology News را بررسی کنید.