Nyelvi modellek transzformáló erővé váltak az életünk különböző területein, az oktatástól a munkáig. Ezek a mély tanuláson alapuló mesterséges intelligencia programok, mint például az OpenAI ChatGPT-je, képesek emberi jellegű szövegeket generálni számos témában. Azonban egy alapvető problémára kell figyelmet fordítanunk – a modellekbe ágyazott kulturális feltételezésekre.
A LLM-eket angol nyelvű szövegadatok elemzésével képzik. Figyelembe véve, hogy az internet angol tartalommal van túlnyomórészt ellátva, a weboldalak 59 százaléka angol nyelvű, a képzési adatok nagyon erősen torzítottak az angol anyanyelvűek tapasztalatai és perspektívái felé, különösen az Egyesült Államokban.
Ez a torzítottság egyre inkább nyilvánvalóvá válik, ha megvizsgáljuk, hogy a LLM-ek hogyan értelmezik egyes helyzeteket. Például a ChatGPT korábban azt feltételezte, hogy Madridban egy pár négy százalék borravalóval kifejezi takarékosságát vagy elégedetlenségét, figyelmen kívül hagyva a spanyol borját nem szokásának. Azonban folyamatos frissítések és képzések révén a ChatGPT képessége javult a kulturális különbségek figyelembevételére, amikor a borravaló megfelelőségét értékeli.
Mindazonáltal más helyzetek továbbra is feltárják a LLM-ekben rejlő implicit kulturális feltételezéseket. Például, ha egy történetet mutatnak be arról, hogy a vendégek 8:30-kor érkeznek vacsorára, a ChatGPT a kések okaira fog spekulálni, feltételezve, hogy egy észak-amerikai vacsora időpontjáról, 6 óráról van szó. Ez rávilágít arra, hogy ezek a modellek milyen szűk, nyugati, észak-amerikai lencsén keresztül tekintik a világot.
A Koppenhágai Egyetem kutatóinak és a kezdő mesterséges intelligencia vállalat, az Anthropic által végzett tanulmányok kvantifikálták ezt a kulturális elfogultságot a LLM-ekben. Az emberi értékeket mérő különböző országokra vonatkozó felmérésekkel a következtetés az volt, hogy erősen összefüggők az amerikai kultúrával.
Ez a probléma nem csak a ChatGPT-ra korlátozódik. Még a DALL-E 3, egy képgeneráló modell is hasonló elfogultságokat mutat. A nyugati országokban készült képeken folytatott képzés alapján a DALL-E 3 olyan reggelit ábrázoló képeket generál, amelyek megfelelnek a nyugati kulturális normáknak.
A rejtett kulturális feltételezésekkel való foglalkozás érdekében kulcsfontosságú a képzési adatok kibővítése, hogy szélesebb körű különböző nyelveket és kulturális perspektívákat foglaljanak magukban. A változatosabb perspektívák beépítésével biztosíthatjuk, hogy a LLM-ek tükrözzék a világ szélesebb körű megértését és elkerüljék a elfogultságok továbbadását.
Gyakran Ismételt Kérdések:
K1: Mi az a nyelvi modellek?
A1: A nyelvi modellek mély tanuláson alapuló mesterséges intelligencia programok, amelyek képesek emberi jellegű szöveget generálni különböző témákban.
K2: Mi a probléma a kulturális feltételezésekkel a nyelvi modellekben?
A2: Az alapvető probléma az, hogy a nyelvi modellek, mint az OpenAI ChatGPT-je, túlnyomórészt angol szövegadatok alapján képződnek, ami kulturális elfogultságot és feltételezéseket eredményez az angol nyelvet beszélők, főként az Egyesült Államokbeliek tapasztalatai és perspektívái alapján.
K3: Hogyan jelentkeznek ezek a kulturális elfogultságok a nyelvi modellekben?
A3: Az elfogultságok megfigyelhetők abban, hogy a nyelvi modellek hogyan értelmezik egyes helyzeteket. Például a ChatGPT tévesen feltételezheti a takarékosságot vagy elégedetlenséget, ha egy madridi pár négy százalék borravalót ad egy étteremben, figyelmen kívül hagyva a spanyol nem borravalózás kulturális normáját.
K4: Sikerült kezelni ezeket az elfogultságokat?
A4: A folyamatos frissítések és képzések javították a ChatGPT kulturális különbségek figyelembevételére való képességét, de az elfogultságok továbbra is fennállnak. Például, ha egy történetet mutatnak be arról, hogy a vacsoravendégek 8:30-kor érkeznek, a ChatGPT spekulálhat a kések okai miatt, feltételezve egy észak-amerikai vacsora 6 órás standard időpontját.
K5: Más nyelvi modelleket is érintenek a kulturális elfogultságok?
A5: Igen, más nyelvi modellek, mint például a DALL-E 3, egy képgeneráló modell is hasonló elfogultságokat mutatnak. A nyugati országokban készült képek alapján a DALL-E 3 olyan reggelit ábrázoló képeket generál, amelyek megfelelnek a nyugati kulturális normáknak.
Meghatározások:
– LLM: Nyelvi Modellek.
– ChatGPT: Az OpenAI chatbotja, mély tanuláson alapuló mesterséges intelligenciával.
– DALL-E 3: Egy képgeneráló modell.
– Kulturális elfogultság: A nyelvi modellek tendenciája, hogy előnyben részesítsék vagy tükrözzék bizonyos csoportok kulturális perspektíváit és feltételezéseit, ebben az esetben az angolul beszélő kultúrákat és nyugati országokat.
Kapcsolódó linkek:
– OpenAI ChatGPT-je
– DALL-E
– Koppenhágai Egyetem
– Anthropic
The source of the article is from the blog lisboatv.pt