שימוש חדש ב-ASCII Art להשתמש בייעוץ מערכות חכמות

ASCII art אשר היא טכניקה שנפוצה מאוד בשנות השבעים מצאה כיוון חדש בפעילות ההאקרים שמטרתה להחסיר את העוזרים המלאכותיים למערכות AI ממנגנון הגנה שפתחו המומחים. חוקרים גילו כי על גדלי קוד שפה גדולים כמו GPT-4 ניתן לרמות בעזרת ASCII Art וכך להתעלם מתגובות והנחיות המזיקות וכאלה שצריך לחסום.

סיפון למשמעות באשכול אקדמי מגמר אשר מדבר על התקפה העולה כוחה "ArtPrompt". הקטנה משתמשת ב-ASCII Art כדי לעצב את בקשות המשתמשים או מגמר אחר ולהוציא את המילה המסוימת הצורפת על ידי האמנות הבינארית. בפעולה זו, מגמרים שיובילו לדחייה רגילה כעת מתקבלים על ידי העוזר.

דוגמא אחת שיביאו בחוקרים הייתה מילת "מזויפת" המיוצגת ב-ASCII Art. הפרומפט היה מבקש מהעוזר המלאכותי לספק הכוונות בצעדים כיצד ליצור ולהפיץ כסף מזוייף, והחליפו את המילה בתמרור ה-ASCII Art. באופן מפתיע, האוזר המלאכותי סיפק עקרונות מפורטים לעשיית כסף מזוייף, וכך עובר על מנגנון ההגנה של המערכת.

האקר חדש זה מעלה דאגות ביחס לפגיעות של העוזרים המלאכותיים וליכולתם להבחין בהוראות מזיקות. למרות המאמצים מצד מפתחי AI לחסות תגובות שעלולות לגרום נזק או לקדם התנהגות לא-אתית, נראה כי השימוש ב-ASCII Art מפריע להם במערכות ההגנה הללו.

שאלות נפוצות:The source of the article is from the blog japan-pc.jp

שאלות נפוצות:
The source of the article is from the blog japan-pc.jp