تأثیر الگوریتم های هوش مصنوعی بر حق تکثیر

در یک تحول اخیر، OpenAI و Google به خاطر آموزش مدل‌های خود به کمک ترجمه‌های ویدیوهای YouTube تحت معاینه قرار گرفتند که احتمالاً به نقض حق تکثیر خالقان منجر شده است. گزارش New York Times نوری افکند بر روی روش‌های این دو شرکت فناوری بزرگ بحث می‌کند و تلاش‌های آنها برای بیشتر کردن منابع داده برای سیستم‌های هوش مصنوعی خود را بیشتر روشن می‌کند. هر چند این شرکت‌ها از روش‌های مختلفی برای بدست آوردن حجم بزرگی از داده استفاده کردند، اما سوالاتی بر سر معیاری قانونی آنها پر شده است.

به گفته شده است که OpenAI از ابزار شناسایی گفتار Whisper خود برای ترجمه بیش از یک میلیون ساعت ویدیوی YouTube استفاده کرده است، سپس از آنها برای آموزش جدیدترین تولید کننده متن به ویدیوی خود، Sora، استفاده کردند. این پیگیری کردن ادعای‌های ابتدایی The Information است که OpenAI از ویدیوهای YouTube و پادکست‌ها برای آموزش سیستم‌های هوش مصنوعی خود استفاده کرده است. جالب است که گرگ بروکمن، رئیس OpenAI، به گفته گفته در این پروژه شرکت داشته.

از نگرانی‌ها در مورد روش های Google نیز یاد شده است، زیرا جستجوی غیر مجاز یا دانلود محتوای YouTube ممنوع است. مات برایان، سخنگوی گوگل، روشن کرد که این شرکت از استفاده OpenAI از ویدیوهای YouTube خبر نداشته و تایید کرد که این اقدامات را تأیید نمی‌کنند. با این حال، گزارش New York Times نشان دهنده این بود که افرادی در گوگل وجود داشتند که از روش‌های OpenAI آگاه بودند اما هیچ اقدامی نکردند، احتمالاً به علت استفاده گوگل از ویدیوهای YouTube به منظور آموزش مدل‌های هوش مصنوعی خود.

**سوالات متداول**

1. آیا OpenAI و Google با استفاده از ترجمه‌های YouTube برای آموزش مدل‌های هوش مصنوعی حق تکثیر را نقض می‌کنند؟
بی نظری و گوگل از ترجمه‌های ویدیو‌های YouTube به منظور آموزش مدل‌های هوش مصنوعی‌شان ممکن است حقوق تکثیروکنندگان را نقض کنند. گزارش New York Times بر این احتمالات تاکید می‌کند و نشان دهنده این است که جمــع‌آوری یا دانلود غیر مجاز محتوای YouTube مجاز نیست. با این حال، گوگل ادعا کرده است که تنها از ویدیوهای پذیرفته شده در برنامۀ آزمایشی تولیدی استفاده می‌کند.

2. چه رویکردی OpenAI در آموزش مدل هوش مصنوعی‌اش پیش گرفت؟
طبق گزارشها، OpenAI گفته می‌شود با ابزار تشخیص گفتار Whisper خود برای ترجمه بیش از یک میلیون ساعت فیلم از YouTube استفاده نموده‌است، که پس از آن برای آموزش تولید کننده متن به ویدیوی خود، Sora، بهره گرفته شده است. این رویکرد جهت بهره برداری از مقدار زیادی از داده برای عملکرد بیشتر مدل‌های هوش مصنوعی بوده است.

3. آیا گوگل استفاده OpenAI از ویدیوهای YouTube به منظور آموزش را تصدیق کرده است؟
گوگل اعلام کرد که از استفاده OpenAI از ویدیوهای YouTube برای آموزش مدل‌های هوش مصنوعی خود آگاه نبوده و روش‌های غیر مجاز جستجوی یا دانلود محتوا را پشتیبانی نمی‌کنند. با این حال، گزارش نشان دهنده است که برخی از افراد در گوگل از روش‌های OpenAI خبر داشتند اما هیچ اقدامی نکردند، احتمالاً به علت استفاده گوگل از ویدیوهای YouTube برای آموزش مدل‌های هوش مصنوعی‌شان.

4. چگونه گوگل سیاست حفاظت از حریم خصوصی خود را گسترش داده است، همان طور که در گزارش اشاره شده است؟
گزارش NYT نشان می دهد که گوگل سیاست حفظ حریم خصوصی خود را در ژوئن 2022 اصلاح کرد تا شامل دامنه گسترده‌تری از محتوای عمومی مانند Google Docs و Google Sheets برای آموزش مدل‌های هوش مصنوعی‌شان و محصولات شامل نموده است. با این حال، برایان تصریح می کند که این فقط با مجوز واضح افرادی که در برنامۀ آزمایشی گوگل شرکت می‌کنند انجام می‌شود. او همچنین بیان کرده است که تغییر در سیاست آنها منجر به آغاز آموزش مدل‌های هوش مصنوعی بر روی انواع داده های اضافی نشده است.

5. آیا OpenAI و گوگل اظهاراتی رسمی در مورد این ادعاها ثبت نموده‌اند؟
Engadget تماسی با هر دو OpenAI و گوگل جهت دریافت نظرات‌شان درباره این موضوع برقرار کرده است. تاکنون هیچ اظهاری از هیچ یک از این شرکت‌ها در مورد ادعاهای مطرح شده در گزارش The New York Times صورت نگرفته است.

علاوه بر اطلاعات ارائه شده در مقاله، موارد مربوط به صنعت، پیش بینی های بورس و مسائل مربوط به صنعت هوش مصنوعی و آموزش مدل‌ها با استفاده از ترجمه‌های YouTube بشرح زیر می‌باشد:

صنعت هوش مصنوعی در سال‌های اخیر تجربه یک رشد قابل ملاحظه را تجربه کرده است، به گونه ای که انتظار می رود اندازه بازار آن تا سال 2025 به 190.61 میلیارد دلار برسد، طبق یک گزارش از MarketsandMarkets. این رشد به علت افزایش تقاضا برای راه حل‌های مبتنی بر هوش مصنوعی در بخش های مختلفی از جامعه از جمله بهداشت، مالی، خرده فروشی و تولید بوده است.

یکی از چالش‌های کلیدی در صنعت هوش مصنوعی نیاز به حجم زیادی از داده‌های با کیفیت بالا برای آموزش مدل‌های هوش مصنوعی به صورت موثر است. شرکت‌هایی مانند OpenAI و Google به طور مداوم منابع داده مختلف را بررسی می کنند، از جمله محتوای عمومی مانند ویدیو‌هایYouTube، به منظور بهبود عملکرد سیستم‌های هوش مصنوعی‌شان.

با این حال، استفاده از ویدیوهای YouTube برای آموزش مدل‌های هوش مصنوعی نگرانی‌ها در مورد نقض حقوق تکثیروکنندگان ایجاد می‌کند. خالقان منحصر به فرد حقوقی به محتواهای خود، از جمله حق تکثیر و توزیع، دارند. جستجوی یا دانلود غیر مجاز ویدیوهای YouTube بدون رضایت خالقان ممکن است این حقوق را نقض کند.

موضوع نقض حق تکثیر در صنعت هوش مصنوعی جدید نیست. در گذشته، مواردی شامل دعاوی دیگر در مورد استفاده از مواد حق تکثیر شده در مجموعه داده‌های آموزشی هوش مصنوعی وجود داشته است. به عنوان مثال، در سال 2019، یک عکاس شکایتی علیه یک شرکت بزرگ هوی مصنوعی برای استفاده از تصاویر حاوی حق تکثیر خود بدون اجازه مراجعه نمود.

به منظور رفع این نگرانی‌های حق تکثیر، شرکت‌هایی مانند گوگل اقداماتی را برای اطمینان حاصل کردن از استفاده تنها از ویدیوهای خالقانی که موافقت کرده‌اند در برنامه‌های تجربی‌شان اتخاذ نموده‌اند. این کار جهت پایبندی به قوانین حق تکثیر و رعایت حقوق خالقان انجام شده است.

با این حال، استفاده از ویدیوهای YouTube برای آموزش مدل‌های هوش مصنوعی تنها یکی از شیوه‌های مورد اختلاف در صنعت نیست. مسائل دیگر شامل تعصب در الگوریتم‌های هوش مصنوعی، نگرانی‌های حریم خصوصی داده، و پیامدهای اخلاقی تصمیم‌گیری هوش مصنوعی از مشکلات دیگر مطرح شده در این صنعت است.

همچنین، از آنجا که صنعت هوش مصنوعی به مرور زمان در حال تحول است، ضروری است که شرکت‌ها برای اطمینان از استفاده مسئولانه و قانونی از داده ها در آموزش مدل‌های هوش مصنوعی، به این موضوعات حقوقی و اخلاقی راهبری کنند.

برای کسب اطلاعات بیشتر در مورد صنعت هوش مصنوعی و مسائل مربوطه می توانید به وب‌سایت‌های زیر مراجعه کنید:

MarketsandMarkets: گزارش‌های تحقیقاتی بورس و تجزیه و تحلیل صنایع مختلف را ارائه می‌دهد.

The source of the article is from the blog maestropasta.cz