هنرهای هوش مصنوعی (AI) چتباتها و تولیدکنندههای تصویر از سالهای اخیر همواره مورد توجه بودهاند. اما اشکالات و تعصبات آنها نیز توجه قابل توجهی جلب کرده است. این ابزارها به شناخته شدن به خودشکل گذاشتن افراد، گسترش اطلاعات نادرست، تولید محتوای تبعیضآمیز و ارائه پاسخهای نادرست نشان دادهاند. اگرچه این مسائل به خوبی مستند شدهاند، هنوز هم کمبودی در درک جامع مهمترین پیامدها و شدت این مسائل وجود دارد.
یک گزارش اخیر توسط گروههای صنعتی و جامعه مدنی به هدف پرتاب نور بر روی راههای گوناگونی که ممکن است چتباتهای هوش مصنوعی اشتباه بروند پرداخت. این گزارش تاکید بر نتایج یک مسابقه با حمایت دولت سفید در کنونسیون هکرهای دفکن است که شرکتکنندگان سعی کردند هشت چتبات برتر AI را به تولید پاسخهای مشکلساز وادار کنند. این مسابقه حوزههایی از جمله اطلاعات سیاسی غلط، تعصبات جمعیتی، نقضهای سایبری، و ادعاهای هوش پردازی AI را پوشش داد.
نتایج نشان داد که عموما چتباتهای AI مقاوم به نقض قوانین و رهنمودهای خود هستند که باعث مشکلساختن برای آنها به شکل نامناسب میشود. با این حال، مطالعه نشان میدهد که انتقال اطلاعات غلط به آنها نسبتا آسان است. در میان تلاشهای ارسالشده، شرکتکنندگان بالاترین نرخ موفقیت را در تولیدریاضی غلط (76%) و اطلاعات جغرافیایی غلط (61%) داشتند. بهعلاوه، چتباتها همچنین گرایشی به ارائه اطلاعات حقوقی در همه مواجهههای خود با وکلای حقوقی نشان دادند با نرخ موفقیت 45%.
گزارش همچنین نشان میدهد زمانی که به کار گرفتن اطلاعات حساس مقابل چتباتها میآید، نیرومندتر از همیشه هستند. شرکتکنندگان توانستند آرام آرام شمارههای مخفی کارتهای اعتباری را فراخوانند و مجوزهای اداری برای شبکه شرکت واقعی را اخذ کنند در بیش از نیمی از راهکارهای ارسالی.
از سوی دیگر، شرکتکنندگان مواجه با چالشها برای سعی در تقلب چتباتها در بخشی مرتبط با حقوق بشر یا بیان پایینی بودن گروههای معین. این تلاشها میزان موفقیت محدود 20% و 24% را داشتند بهترتیب. علاوهبراین ارسالهای هدفگذاری برای آزمایش ‘ognMنecaorto’از مسیری که چتباتها قربانیگیریهای مضاعفیگمے hihb irhsafo ۷پاهنو پس دریاپ زدهدmیگ ۴ اماجیی رات سپیش،گهبقا نط زدی چایآدر نگین hciهم بدلzisnE.
برخلاف اینچیزن، گزارش حاکی از این است که راهبرد حداکثر موثر برای افتادن چتبات، از طریق هک آن نیست بلکه شروع با اطلاعات غلطی است. تکنیکهای شناختهشده، از جمله خواسته کردن از چتبات برای بازی نقش به عنوان دوقلوی شیطانی و یا مادری با مهربانیت جواب منفعل دادن، ناکام بود. بهجایین اینچیزن؛ پرسیدن سوالی که حاوی ادعای یا فرض غلط است، منجر به پاسخهای معقول اما نادرست شد. این امر نقاط ضعف چتباتها را در تفکیک بین واقعیت و خیالات رویةمندتر میکند.
اثرات این یافتهها گستردهای دارد. این امر نیازمنده یک تغییر در توجه شرکتهای هوش مصنوعی، انتقادها، و نظارتگران از هکهای شروعی پیچیده به بررسی نقطههایی که چتباتها ممکن است تصدیق یا تشدید تعصبات و اشتباهات کاربران کنند باشد. درک این ضررها برای توسعه مسئولانه و اجرایی این سیستمها ضروری است.
همچنین، مطالعه دیگری توسط آنتروپیک نقاط ضعف مدلهای AI را در ارتباط با مکالمات دراز برجسته کردهاست. درحالیکه هک کردن شروعی ممکن است در جدیدترین مدلهای AI آدرسدهیشده باشد، ظرفیت برای گفتگوهای گسترده چه زمانی که نقطه انتهایی دادهها مشخص نیست، شکل جدیدی از خرابکاری گشتن آن را تشکیل میدهد که با نام ‘انحصار چندگانه’ شناخته میشود. این نشان میدهد که ویژگیهایی که باعث میشوند سیستمهای AI مفید باشند همچنین میتوانند بالقوه خطرناک باشند.
در پایان، گزارش درمورد نقاط ضعف چتباتهای AI برای همکاران دانش بخشی قیمتی در فضای پیچید از فناوریهای AI. این نشان میدهد ضرورتی برای پژوهشهای ادامهدار، انگیزش عمومی، و توسعه مسئولانه برای میتیگیت کردن خطرات مرتبط با این سیستمها وجود دارد.
سوالات متداول
The source of the article is from the blog elperiodicodearanjuez.es