رویکردهای جدید در حذف اطلاعات حساس از مدل‌های هوش مصنوعی

خلاصه:
حذف اطلاعات حساس از مدل‌های تولید زبان یک کار ضروری برای تامین حریم خصوصی و امنیت شده است. این فرایند شامل اصلاح مدل‌ها پس از آموزش جهت فراموش کلیه عناصر خاصی از داده‌های آموزشی آن‌ها می‌شود. در حالی که حذف اطلاعات حساس بیشتر در مدل‌های طبقه‌بندی معروف است، همچنان نیاز به تمرکز بر مدل‌های تولیدی مانند مدل‌های زبان وجود دارد. به تازگی، پژوهشگران دانشگاه کارنگی ملون مجموعه آزمایش TOFU (Task of Fictitious Unlearning) را معرفی کردند تا کارایی حذف اطلاعات در مدل‌های تولیدی زبان را ارزیابی کنند.

ارزیابی کیفیت فراموشی و کارایی مدل:
TOFU با استفاده از مجموعه داده‌هایی شامل نمونه‌های خلقی از پروفایل نویسنده، بررسی کیفیت فراموشی در مدل‌های تولیدی زبان را امکان‌پذیر می‌سازد. این مجموعه داده شامل 200 پروفایل است که هر کدام دارای 20 جفت سوال و پاسخ می‌باشند. در این مجموعه داده، زیرمجموعه‌ای به نام “مجموعه فراموشی” برای حذف انتخاب می‌شود. ارزیابی در دو محور کلیدی انجام می‌شود: کیفیت فراموشی و کارایی مدل.

کیفیت فراموشی با استفاده از معیارها و مجموعه داده‌های ارزیابی مختلف ارزیابی می‌شود که امکان بررسی جامع فرایند حذف اطلاعات را می‌دهد. از طرف دیگر، کارایی مدل مقایسه‌ای از احتمال تولید پاسخ‌های درست به پاسخ‌های نادرست در مجموعه فراموشی است. مدل‌های حذف‌شده آماری با مدل‌های استاندارد نگه‌داشت شده که هرگز بر داده‌های حساس آموزش ندیده‌اند، مقایسه می‌شود.

محدودیت‌ها و جهت‌های آینده:
اگرچه مجموعه آزمایش TOFU یک گام مهم در درک فرایند حذف اطلاعات در مدل‌های تولیدی زبان است، اما تعدادی محدودیت نیز وجود دارد. چارچوب کنونی به طور اصلی بر روی فراموشی سطح موجودیت تمرکز دارد و عدم توجه به حذف سطح نمونه و رفتار، که نیز در نظر گرفته شده است، از مواردی است. علاوه بر این، این چارچوب به تأمین هماهنگی با ارزش‌های انسانی پرداخت نمی‌کند که جنبه مهم دیگری از حذف اطلاعات است.

مجموعه آزمایش TOFU نقاط ضعف الگوریتم‌های حذف اطلاعات موجود را برجسته می‌کند و نیاز به راهکارهای موثرتری را مورد توجه قرار می‌دهد. توسعه بیشتر برای برقراری تعادل بین حذف اطلاعات حساس و حفظ کارایی و کاربرد کلی مدل ضروری است.

به طور خلاصه، حذف اطلاعات نقش حیاتی در مقابله با مسائل قانونی و اخلاقی مرتبط با حریم خصوصی افراد در سیستم‌های هوش مصنوعی دارد. مجموعه آزمایش TOFU یک روش جامع برای ارزیابی ارائه می‌دهد و پیچیدگی‌های حذف اطلاعات در مدل‌های تولیدی زبان را نشان می‌دهد. ادامه نوآوری در روش‌های حذف اطلاعات برای تضمین حریم خصوصی و امنیت در حالت کلی مدل‌های تولید زبانی ضروری است.

برای مطالعه عمیق‌تر درباره این موضوع مهم به مقاله پژوهشی اصلی [اینجا](https://arxiv.org/abs/2401.06121) مراجعه کنید. با ما در توییتر و در پیج ام ال پرینت و Facebook Community و Discord Channel و LinkedIn Group برای به روزرسانی‌های پژوهشی بیشتر در ارتباط باشید. همچنین، از عضویت در خبرنامه و پیوستن به کانال تلگرام برای جدیدترین اخبار و رویدادهای هوش مصنوعی خبر اندازید. با هم، به جهانی شکل دهیم که فناوری به افراد قدرت و حفاظت بدهد.

The source of the article is from the blog jomfruland.net