در یک تحول اخیر، OpenAI و Google به خاطر آموزش مدلهای خود به کمک ترجمههای ویدیوهای YouTube تحت معاینه قرار گرفتند که احتمالاً به نقض حق تکثیر خالقان منجر شده است. گزارش New York Times نوری افکند بر روی روشهای این دو شرکت فناوری بزرگ بحث میکند و تلاشهای آنها برای بیشتر کردن منابع داده برای سیستمهای هوش مصنوعی خود را بیشتر روشن میکند. هر چند این شرکتها از روشهای مختلفی برای بدست آوردن حجم بزرگی از داده استفاده کردند، اما سوالاتی بر سر معیاری قانونی آنها پر شده است.
به گفته شده است که OpenAI از ابزار شناسایی گفتار Whisper خود برای ترجمه بیش از یک میلیون ساعت ویدیوی YouTube استفاده کرده است، سپس از آنها برای آموزش جدیدترین تولید کننده متن به ویدیوی خود، Sora، استفاده کردند. این پیگیری کردن ادعایهای ابتدایی The Information است که OpenAI از ویدیوهای YouTube و پادکستها برای آموزش سیستمهای هوش مصنوعی خود استفاده کرده است. جالب است که گرگ بروکمن، رئیس OpenAI، به گفته گفته در این پروژه شرکت داشته.
از نگرانیها در مورد روش های Google نیز یاد شده است، زیرا جستجوی غیر مجاز یا دانلود محتوای YouTube ممنوع است. مات برایان، سخنگوی گوگل، روشن کرد که این شرکت از استفاده OpenAI از ویدیوهای YouTube خبر نداشته و تایید کرد که این اقدامات را تأیید نمیکنند. با این حال، گزارش New York Times نشان دهنده این بود که افرادی در گوگل وجود داشتند که از روشهای OpenAI آگاه بودند اما هیچ اقدامی نکردند، احتمالاً به علت استفاده گوگل از ویدیوهای YouTube به منظور آموزش مدلهای هوش مصنوعی خود.
**سوالات متداول**
1. آیا OpenAI و Google با استفاده از ترجمههای YouTube برای آموزش مدلهای هوش مصنوعی حق تکثیر را نقض میکنند؟
بی نظری و گوگل از ترجمههای ویدیوهای YouTube به منظور آموزش مدلهای هوش مصنوعیشان ممکن است حقوق تکثیروکنندگان را نقض کنند. گزارش New York Times بر این احتمالات تاکید میکند و نشان دهنده این است که جمــعآوری یا دانلود غیر مجاز محتوای YouTube مجاز نیست. با این حال، گوگل ادعا کرده است که تنها از ویدیوهای پذیرفته شده در برنامۀ آزمایشی تولیدی استفاده میکند.
2. چه رویکردی OpenAI در آموزش مدل هوش مصنوعیاش پیش گرفت؟
طبق گزارشها، OpenAI گفته میشود با ابزار تشخیص گفتار Whisper خود برای ترجمه بیش از یک میلیون ساعت فیلم از YouTube استفاده نمودهاست، که پس از آن برای آموزش تولید کننده متن به ویدیوی خود، Sora، بهره گرفته شده است. این رویکرد جهت بهره برداری از مقدار زیادی از داده برای عملکرد بیشتر مدلهای هوش مصنوعی بوده است.
3. آیا گوگل استفاده OpenAI از ویدیوهای YouTube به منظور آموزش را تصدیق کرده است؟
گوگل اعلام کرد که از استفاده OpenAI از ویدیوهای YouTube برای آموزش مدلهای هوش مصنوعی خود آگاه نبوده و روشهای غیر مجاز جستجوی یا دانلود محتوا را پشتیبانی نمیکنند. با این حال، گزارش نشان دهنده است که برخی از افراد در گوگل از روشهای OpenAI خبر داشتند اما هیچ اقدامی نکردند، احتمالاً به علت استفاده گوگل از ویدیوهای YouTube برای آموزش مدلهای هوش مصنوعیشان.
4. چگونه گوگل سیاست حفاظت از حریم خصوصی خود را گسترش داده است، همان طور که در گزارش اشاره شده است؟
گزارش NYT نشان می دهد که گوگل سیاست حفظ حریم خصوصی خود را در ژوئن 2022 اصلاح کرد تا شامل دامنه گستردهتری از محتوای عمومی مانند Google Docs و Google Sheets برای آموزش مدلهای هوش مصنوعیشان و محصولات شامل نموده است. با این حال، برایان تصریح می کند که این فقط با مجوز واضح افرادی که در برنامۀ آزمایشی گوگل شرکت میکنند انجام میشود. او همچنین بیان کرده است که تغییر در سیاست آنها منجر به آغاز آموزش مدلهای هوش مصنوعی بر روی انواع داده های اضافی نشده است.
5. آیا OpenAI و گوگل اظهاراتی رسمی در مورد این ادعاها ثبت نمودهاند؟
Engadget تماسی با هر دو OpenAI و گوگل جهت دریافت نظراتشان درباره این موضوع برقرار کرده است. تاکنون هیچ اظهاری از هیچ یک از این شرکتها در مورد ادعاهای مطرح شده در گزارش The New York Times صورت نگرفته است.
علاوه بر اطلاعات ارائه شده در مقاله، موارد مربوط به صنعت، پیش بینی های بورس و مسائل مربوط به صنعت هوش مصنوعی و آموزش مدلها با استفاده از ترجمههای YouTube بشرح زیر میباشد:
صنعت هوش مصنوعی در سالهای اخیر تجربه یک رشد قابل ملاحظه را تجربه کرده است، به گونه ای که انتظار می رود اندازه بازار آن تا سال 2025 به 190.61 میلیارد دلار برسد، طبق یک گزارش از MarketsandMarkets. این رشد به علت افزایش تقاضا برای راه حلهای مبتنی بر هوش مصنوعی در بخش های مختلفی از جامعه از جمله بهداشت، مالی، خرده فروشی و تولید بوده است.
یکی از چالشهای کلیدی در صنعت هوش مصنوعی نیاز به حجم زیادی از دادههای با کیفیت بالا برای آموزش مدلهای هوش مصنوعی به صورت موثر است. شرکتهایی مانند OpenAI و Google به طور مداوم منابع داده مختلف را بررسی می کنند، از جمله محتوای عمومی مانند ویدیوهایYouTube، به منظور بهبود عملکرد سیستمهای هوش مصنوعیشان.
با این حال، استفاده از ویدیوهای YouTube برای آموزش مدلهای هوش مصنوعی نگرانیها در مورد نقض حقوق تکثیروکنندگان ایجاد میکند. خالقان منحصر به فرد حقوقی به محتواهای خود، از جمله حق تکثیر و توزیع، دارند. جستجوی یا دانلود غیر مجاز ویدیوهای YouTube بدون رضایت خالقان ممکن است این حقوق را نقض کند.
موضوع نقض حق تکثیر در صنعت هوش مصنوعی جدید نیست. در گذشته، مواردی شامل دعاوی دیگر در مورد استفاده از مواد حق تکثیر شده در مجموعه دادههای آموزشی هوش مصنوعی وجود داشته است. به عنوان مثال، در سال 2019، یک عکاس شکایتی علیه یک شرکت بزرگ هوی مصنوعی برای استفاده از تصاویر حاوی حق تکثیر خود بدون اجازه مراجعه نمود.
به منظور رفع این نگرانیهای حق تکثیر، شرکتهایی مانند گوگل اقداماتی را برای اطمینان حاصل کردن از استفاده تنها از ویدیوهای خالقانی که موافقت کردهاند در برنامههای تجربیشان اتخاذ نمودهاند. این کار جهت پایبندی به قوانین حق تکثیر و رعایت حقوق خالقان انجام شده است.
با این حال، استفاده از ویدیوهای YouTube برای آموزش مدلهای هوش مصنوعی تنها یکی از شیوههای مورد اختلاف در صنعت نیست. مسائل دیگر شامل تعصب در الگوریتمهای هوش مصنوعی، نگرانیهای حریم خصوصی داده، و پیامدهای اخلاقی تصمیمگیری هوش مصنوعی از مشکلات دیگر مطرح شده در این صنعت است.
همچنین، از آنجا که صنعت هوش مصنوعی به مرور زمان در حال تحول است، ضروری است که شرکتها برای اطمینان از استفاده مسئولانه و قانونی از داده ها در آموزش مدلهای هوش مصنوعی، به این موضوعات حقوقی و اخلاقی راهبری کنند.
برای کسب اطلاعات بیشتر در مورد صنعت هوش مصنوعی و مسائل مربوطه می توانید به وبسایتهای زیر مراجعه کنید:
MarketsandMarkets: گزارشهای تحقیقاتی بورس و تجزیه و تحلیل صنایع مختلف را ارائه میدهد.
The source of the article is from the blog maestropasta.cz