روش‌های جدید در آموزش هوش مصنوعی منبع بحث اخلاقی می‌شود

یک تحقیق مهم از Technology News، یک آشفتگی جدید را در زمینه توسعه هوش مصنوعی به روشنی آورده است. غول‌های صنعت اقدام به استفاده از مدل‌های هوش مصنوعی خود که بر اساس مجموعه‌داده‌ای تشکیل شده از بیش از ۱۷۳،۰۰۰ کلیپ ویدیویی یوتیوب بدون رضایت کاربران کرده‌اند.

مجموعه‌داده، به سرپرستی سازمان غیرانتفاعی EleutherAI بوده و شامل قسمت‌هایی از ویدیوهای یوتیوب از بیش از ۴۸٬۰۰۰ کانال مختلف است که شرکت‌هایی چون اپل، انویدیا و آنتروپیک از آن بهره برده‌اند. این موضوع نوری بر واقعیت ناراحت‌کننده این است که فناوری هوش مصنوعی از داده‌هایی که از محتوی‌سازان بدون رضایت و یا کرایه آن‌ها به دست می‌آورد، به شدت وابسته است.

برخلاف محتوای اصلی، مجموعه‌داده شامل هیچ کلیپ ویدیویی واقعی نمی‌باشد، بلکه اطلاعات متنی از خالقان برتر پلتفرم‌هایی چون مارکوس براونلی و مستربیست همراه با ناشران خبری بزرگی چون The New York Times، BBC و ABC News است. توصیف‌هایی از کلیپ‌های ویدیویی انگجت هم به این مجموعه‌داده افزوده شده است که به یک چالش اخلاقی خود را در منظر هوش مصنوعی می‌برد.

گزارش شده است که اپل اطلاعات هوش مصنوعی را از منابع مختلف به‌جمله یک استحصال اطلاعات از کلیپ‌های ویدیویی یوتیوب به دست می‌آورد که این روش مشکلات اخلاقی ایجاد می‌کند. در پی این آشفتگی، شرکت‌هایی چون اپل و انویدیا به درخواست‌های نظری خود بی‌پاسخ مانده‌اند و این نشانگر عدم شفافیت درباره داده‌هایی که برای آموزش مدل‌های هوش مصنوعی استفاده می‌کنند می‌باشد.

یوتیوب به‌عنوان یک انبار عظیم از محتوای ویدیویی به صورت جهانی برای آموزش مدل‌های هوش مصنوعی ایستاده است و به عنوان یک زرگرانگی مرغوب برای این کار شناخته می‌شود، که محدود به داده‌های متنی نیست بلکه تا صدا، ویدیو و تصاویر نیز می‌رود. مباحث اخلاقی اطراف استفاده از داده‌های یوتیوب برای آموزش مدل‌های هوش مصنوعی دائماً در حال تشدید است و بر اهمیت شفافیت و رضایت در این منظره فناورانه دنیایی تاکید می‌شود.

ابعاد جدید در بحث‌های اخلاقی در مورد آموزش هوش مصنوعی

در بحث‌های مداوم مرتبط با آموزش مدل‌های هوش مصنوعی، فاش شدن تحقیقات بیشتر به روشنی نکته‌های حیاتی را که نیازمند توجه و بررسی هستند برجای گذاشته است.

یکی از سوالات کلیدی که پیش می‌آید، مربوط به اندازه‌ای است که خالقان محتوا باید کنترلی روی مواد خود داشته باشند زمانی که برای آموزش هوش مصنوعی استفاده می‌شود. آیا باید توافقات رسمی یا ساختارهای کرایه‌دهی تعیین شود تا استفاده منصفانه از داده‌ها تضمین شود، به ویژه زمانی که از پلتفرم‌هایی چون یوتیوب نیازمندیم؟

سوال مهم دیگری در ارتباط با شفافیتی که توسط نهادهای صنعتی حفظ شده است زمانی که بازبینی داده برای آموزش هوش مصنوعی انجام می‌شود بحرانی است. چگونه شرکت‌هایی چون اپل و انویدیا می‌توانند ارتباطات و فرآیندهای افشا را ارتقا دهند تا مسائل اخلاقی را پوشش دهند و با هر دو کاربران و خالقان محتوا اعتماد حفظ کنند؟

یکی از چالش‌های اساسی مرتبط با استفاده از مجموعه‌داده‌های بزرگ از پلتفرم‌هایی چون یوتیوب، نقض حقوق مالکیت فکری است. دغدغه اخلاقی آن زمانی پیدا می‌شود که مدل‌های هوش مصنوعی بدون رضایت صریح بر داده‌ها آموزش داده شوند و مسائلی مانند حقوق حفظ حریم شخصی، حق تکثیر و حقوق مالکیت پیش بیایند.

مزایای بهره‌برداری از انبارهای وسیع مانند یوتیوب برای آموزش هوش مصنوعی شامل دسترسی به داده‌های متنوع و گسترده‌ای است که می‌تواند عملکرد و قابلیت‌های مدل‌های هوش مصنوعی را افزایش دهد. اما این مزیت با اختلافات مربوط به ابعاد اخلاقی و نیاز به چارچوب‌های اخلاقی سخت‌گیرانه برای هدایت استفاده مسئولانه از چنین داده‌هایی مقابله می‌شود.

آشفتگی‌های مرتبط با استفاده از کلیپ‌های ویدیویی یوتیوب برای آموزش هوش مصنوعی نیاز به تعیین رهنمودهای واضح، دریافت رضایت و اطمینان از مسئولیت‌پذیری در فرآیند توسعه هوش مصنوعی را برجسته سازد. با پیشرفت‌های فناوری که به ترقی‌هایی منجر شده است، امری ضروری است که به دقت در مورد ملاحظات اخلاقی پاسخ دهیم.

برای درک بیشتر از ابعاد اخلاقی آموزش هوش مصنوعی و استفاده از داده‌ها، می‌توانید مقالات Technology News را بررسی کنید.

Sparks! | Anja Kaspersen | Good and evil: ethics and fairness in AI, who makes the rules?