Kunskapsredigering: Förbättring av stora språkmodeller för rättvisa och säkerhet

Ett forskarteam från Zhejiang University, National University of Singapore, University of California, Ant Group och Alibaba Group har genomfört en studie som fokuserar på kunskapsredigering för stora språkmodeller (Large Language Models, LLM). LLM har nyligen visat sin imponerande förmåga att bearbeta och memorera omfattande mängder information, överstigande människans kapacitet.

För att säkerställa rättvisa och säkerhet i artificiell intelligens (AI)-system är det viktigt att förstå hur LLM visar och bearbetar information. Denna studie syftar till att undersöka historien och den aktuella statusen för kunskapsredigeringsmetoder för LLM. Forskarna ger en översikt över LLM:s design, hur kunskap lagras samt relaterade metoder som effektiv finjustering av parametrar, kunskapsökning, kontinuerlig inlärning och maskinavlärande.

Forskarna klassificerar strategier för kunskapsredigering för LLM i tre kategorier: redigering av intern kunskap, sammanslagning av kunskap i modellen och användning av extern kunskap. Dessa strategier hämtar inspiration från mänskliga kognitiva processer som igenkänning, association och mästerskapsfasen i inlärning.

Studien inkluderar experiment som utförts på tolv dataset för naturlig språkbearbetning och noga beaktar prestanda, användbarhet, underliggande mekanismer och andra faktorer. Forskarna skapar en referenspunkt kallad KnowEdit för att utvärdera infogande, modifiering och radering av information med hjälp av toppmoderna kunskapsredigeringsmetoder för LLM.

Resultaten visar hur kunskapsredigering påverkar allmänna uppgifter och redigering av kunskap för flera uppgifter, och visar att den framgångsrikt uppdaterar fakta utan att i hög grad påverka modellens kognitiva förmågor och anpassningsförmåga inom olika kunskapsområden. Dessutom utforskar forskarna begränsningarna och potentiella konsekvenser av kunskapsredigering för LLM.

Dessutom diskuterar studien det breda spektrumet av tillämpningar för kunskapsredigering, inklusive pålitlig AI, effektiv maskininlärning, AI-genererat innehåll och individualiserade agenter i mänsk-dator-interaktion. Forskarna hoppas att denna forskning kommer inspirera ytterligare utforskning av LLM med fokus på både effektivitet och kreativitet.

Forskarna har gjort alla sina resurser, inklusive koder, datauppsplittringar och tränade modellkontrollpunkter, offentligt tillgängliga för att främja vidare studier inom detta område.

The source of the article is from the blog maestropasta.cz