افزایش نیازهای داده برای پیشرفت هوش مصنوعی
در مرکز هر تعامل با یک چتبات – یک برنامه طراحی شده برای شبیهسازی گفتگوها با انسانها – یک مخزن دادههای گسترده قرار دارد. این مجموعه بزرگی اطلاعات، از مقالات بیشمار، کتب و نظرات آنلاین، برای آموزش سیستمهای هوش مصنوعی به منظور درک و پاسخ به سوالات کاربران بسیار حیاتی است. تقاضا برای تزریق پیوسته دادهها اجتنابناپذیر است: چه بیشتر داده به یک هوش مصنوعی وارد شود، دقت آن بیشتر میشود.
مشکل دسترسی به دادههای با کیفیت
با وجود شیوع اطلاعات در زندگی روزانه، تنها یک بخش کوچکی از آن که ارزش قابل توجهی دارد، راهش به اینترنت پیدا میکند. کنترل این منبع اصلیاً نادیده شده میتواند برای شرکتهای هوش مصنوعی هزینهبر باشد. آنها اغلب میلیونها دلار به دست آوردن حقوق از ناشران صرف میکنند یا مجبور به استفاده از تمام وبسایتها میشوند، که دعواهای قوی حق تکثیر محتوای آنها را به وجود میآورد.
پذیرش دادههای مصنوعی به عنوان یک راهکار
عناصر تکنولوژی اکنون بر روی یک مسیر شروع شدهاند که از دادههای مصنوعی بهره میبرند، اطلاعاتی مختصر مصنوعی که به صورت اصلی به وسیله الگوریتمها استخراج شدهاند، برای ساخت و آزمایش مدلهای هوش مصنوعی. با استفاده از هوش مصنوعی برای تولید دادههای مصنوعی به صورت انواع مختلف، نسخههای آینده این سیستمها قادر به آموزش بهتر خواهند بود. داریو آمادی، مدیر عامل انتروپیک هوش مصنوعی، امکانات دادههای مصنوعی را به عنوان ابزاری “برای تولید بیپایان داده” تأیید میکند – که مسائل حقوقی، اخلاقی و حریم خصوصی را در نظر نمیگیرد.
کاربردهای دادههای مصنوعی در فناوری
دادههای مصنوعی یک تاریخچه دورهها دارند، از فرآیندهای نازنیشهسازی تا شبیهسازی ترافیک برای فناوری خودروهای خودران. با این حال، پیشرفتهای هوش مصنوعی که ساخت دادههای مصنوعی با کیفیت بالا به مقیاس بزرگ را آسانتر کردهاست، ضرورت جدیدی برای پیگیری آنها را ایجاب میکند.
شرکتهایی مانند انتروپیک هوش مصنوعی برای آخرین مدلهای چتبات خود از دادههای مصنوعی استفاده کردهاند، در حالی که غولتکنولوژیها Meta و Google از آن در توسعه مدلهای اوپنسورس جدید خود بهره بردند. به عنوان مثال، DeepMind شرکت گوگل برای آموزش مدلهای کارا در حل مسائل هندسه سطح المپیک، از دادههای مصنوعی بهره میبرد.
علاوه بر این، تحقیقات مایکروسافت در زمینه هوش مصنوعی مصنوعی، منجر به توسعه مدلهوش مصنوعی کوچکتر، کمتر نیازمند منابع قابلیت تفکر منطقی و استفاده از زبان مؤثر شدهاست. این مدل با نام Phi-3 روندی را به شبیه سازی یادگیری زبان کودکان پیگیری میکند و به عنوان ابزار اوپنسورس عمومی در دسترس است.