TOFU: انقلاب در هوش مصنوعی با قدرت فراموشی

دنیای هوش مصنوعی به طولانی شدن با توانایی یادگیری ماشین به شدت جذب شده است، اما درباره فراموشی ماشین چه؟ در حالی که یادگیری تا حد زیادی کاوش شده است، فراموشی بخشی بزرگی از دامنه آن به صورت عمده بی‌گمان باقی می‌ماند. به این ایراد پاسخ داده شده و تیمی از دانشگاه کارنگی ملون موسسه TOFU را آغاز کردند – یک پروژه‌ی نوآورانه که هدف آن تجهیز سامانه‌های هوش مصنوعی با توانایی “فراموشی” اطلاعات خاص است.

فراموشی با اهمیت بزرگی در حوزه هوش مصنوعی به دلیل مسائل مربوط به حریم خصوصی مرتبط با قابلیت‌های در حال گسترش مدل‌های زبان بزرگ (LLM) است. این مدل‌هایی که بر اساس حجم عظیمی از داده‌ها در وب آموزش دیده شده‌اند، قابلیت دارند اطلاعات حساس یا شخصی را به طور ناخواسته حفظ کرده و تولید کنند. این مسئله باعث پیچیدگی‌های اخلاقی و حقوقی می‌شود. TOFU به عنوان یک راه‌حل متمرکز بر پاک کردن انتخابی اطلاعات از سامانه‌های هوش مصنوعی است، در حالی که پایگاه دانش کلی آن را حفظ می‌کند.

از اطلاعات مصنوعی منحصر به فردی که با استفاده از زندگینامه نویسندگان خیالی ساخته شده با GPT-4 درست شده است TOFU پتانسیل بالقوه‌ای برخوردار می‌شود. این مجموعه داده به TOFU اجازه می‌دهد تا LLM‌ها را در یک محیط کنترل شده تنظیم کند که در آن روند فراموشی به طور واضح تعریف شده است. هر پروفایل در مجموعه داده TOFU متشکل از 20 جفت سوال-پاسخ است، با یک زیرمجموعه خاص به نام “مجموعه فراموشی” که باید فراموش شود.

موثریت فراموشی از طریق یک چارچوب پیچیده که TOFU معرفی کرده‌است ارزیابی می‌شود. این چارچوب شامل معیارهایی مانند احتمال، امتیازهای ROUGE و نسبت حقیقت است. ارزیابی در دسته‌بندی‌های متنوع، از جمله مجموعه فراموشی، مجموعه حفظ شده، نویسندگان واقعی و حقیقت‌های جهان، انجام می‌شود. هدف نهایی آموزش سامانه‌های هوش مصنوعی به فراموشی اطلاعات هدف و همزمان حفظ عملکرد بهینه بر روی مجموعه حفاظت شده است که به تضمین فراموشی دقیق و هدفمند می‌پردازد.

TOFU علاوه بر رویکرد نوآورانه ای که نشان می‌دهد، به طبیعت پیچیده‌ی فراموشی ماشین نیز روشن نور می‌اندازد. ارزیابی روش‌های پایه نشان می‌دهد که روش‌های موجود به خوبی با چالش فراموشی مقابله نمی‌کنند که نشان‌دهنده فضای کافی برای بهبود است. رسیدن به تعادل مناسب بین فراموشی داده‌های ناخواسته و حفظ اطلاعات ارزشمند چالش قابل توجهی است، چالشی که TOFU با توسعه روزافزونی فعال به جلوی آن رفتار را در پیش دارد.

در پایان، TOFU راهبرد اولیه در زمینه فراموشی هوش مصنوعی را به راه می‌اندازد و پیشتاز توسعه‌های آینده در این حوزه مهم است. با تاکید بر حریم خصوصی داده در LLM‌ها، TOFU پیشرفت‌های فناوری را هماهنگ با استانداردهای اخلاقی می‌سازد. بدون شک، تا زمانی که هوش مصنوعی در حال تکامل است، پروژه‌هایی مانند TOFU نقش بسیار مهمی در اطمینان از اینکه پیشرفت‌ها مسئولانه هستند و اهمیت به حفظ حریم خصوصی می‌دهند، ایفا خواهند کرد.

بخش سوالات رایج: فراموشی در هوش مصنوعی

1. فراموشی ماشین چیست؟
فراموشی ماشین فرایندی است که سیستم‌های هوش مصنوعی را با توانایی “فراموشی” اطلاعات خاص تجهیز می‌کند.

2. چرا فراموشی در هوش مصنوعی اهمیت دارد؟
فراموشی در هوش مصنوعی به این دلیل مهم است که به ایرادهای مرتبط با حریم خصوصی که با مدل‌های زبان بزرگ (LLMs) همراه است، پاسخ می‌دهد؛ مدل‌هایی که ممکن است درهم و برهم اطلاعات حساس یا شخصی را حفظ و تولید کنند.

3. TOFU چیست؟
TOFU پروژه‌ای نوآورانه است که توسط تیمی از دانشگاه کارنگی ملون توسعه یافته است، هدف آن این است که به سامانه‌های هوش مصنوعی امکان حذف هدفمند اطلاعات را داده و بایدهای عمومی‌شان را حفظ کند.

4. چگونه مجموعه داده TOFU ایجاد می‌شود؟
TOFU از زندگینامه‌های مصنوعی نوشته شده توسط GPT-4 استفاده می‌کند تا مجموعه داده‌ی منحصر‌به‌فردی را ایجاد کند. هر پروفایل شامل 20 جفت سوال-پاسخ است، با یک زیرمجموعه خاص به نام “مجموعه فراموشی” که باید یاداشت شوند.

5. چگونه موثریت فراموشی در TOFU ارزیابی می‌شود؟
TOFU یک چارچوب پیچیده معرفی می‌کند که موثریت فراموشی را ارزیابی می‌کند. این چارچوب شامل متریک‌های احتمال، امتیازهای ROUGE و نسبت حقیقت است. ارزیابی در بین مجموعه‌های داده‌ای متنوع انجام می‌شود، از جمله مجموعه فراموشی، مجموعه حفظ‌شده، نویسندگان واقعی و حقایق جهان.

6. چالش‌های فراموشی ماشین چیست؟
روش‌های موجود فراموشی ماشین به طور موثری به مواجهه با چالش تعادل مناسب بین فراموشی داده‌های ناخواسته و حفظ اطلاعات ارزشمند پاسخ نمی‌دهند.

7. هدف TOFU چیست؟
هدف نهایی TOFU این است که سامانه‌های هوش مصنوعی را به فراموشی داده‌های هدف آموزش دهد در حالی که بر روی مجموعه حفظ‌شده‌ی عملکرد بهینه را حفظ کند، تا فراموشی دقیق و هدفمندی را تأمین کند.

ترجمه اصطلاحات کلیدی:

– مدل‌های زبان بزرگ (LLMs): مدل‌های هوش مصنوعی آموزش دیده بر روی حجم زیادی از داده از وب.
– مجموعه فراموشی: یک زیرمجموعه خاصی از داده که باید فراموش شود.
– مجموعه حفظ‌شده: بخشی از داده‌ی سامانه‌ی هوش مصنوعی که حفظ م

The source of the article is from the blog toumai.es