Nyelvi modellek hatása a kulturális feltételezésekre

Nyelvi modellek transzformáló erővé váltak az életünk különböző területein, az oktatástól a munkáig. Ezek a mély tanuláson alapuló mesterséges intelligencia programok, mint például az OpenAI ChatGPT-je, képesek emberi jellegű szövegeket generálni számos témában. Azonban egy alapvető problémára kell figyelmet fordítanunk – a modellekbe ágyazott kulturális feltételezésekre.

A LLM-eket angol nyelvű szövegadatok elemzésével képzik. Figyelembe véve, hogy az internet angol tartalommal van túlnyomórészt ellátva, a weboldalak 59 százaléka angol nyelvű, a képzési adatok nagyon erősen torzítottak az angol anyanyelvűek tapasztalatai és perspektívái felé, különösen az Egyesült Államokban.

Ez a torzítottság egyre inkább nyilvánvalóvá válik, ha megvizsgáljuk, hogy a LLM-ek hogyan értelmezik egyes helyzeteket. Például a ChatGPT korábban azt feltételezte, hogy Madridban egy pár négy százalék borravalóval kifejezi takarékosságát vagy elégedetlenségét, figyelmen kívül hagyva a spanyol borját nem szokásának. Azonban folyamatos frissítések és képzések révén a ChatGPT képessége javult a kulturális különbségek figyelembevételére, amikor a borravaló megfelelőségét értékeli.

Mindazonáltal más helyzetek továbbra is feltárják a LLM-ekben rejlő implicit kulturális feltételezéseket. Például, ha egy történetet mutatnak be arról, hogy a vendégek 8:30-kor érkeznek vacsorára, a ChatGPT a kések okaira fog spekulálni, feltételezve, hogy egy észak-amerikai vacsora időpontjáról, 6 óráról van szó. Ez rávilágít arra, hogy ezek a modellek milyen szűk, nyugati, észak-amerikai lencsén keresztül tekintik a világot.

A Koppenhágai Egyetem kutatóinak és a kezdő mesterséges intelligencia vállalat, az Anthropic által végzett tanulmányok kvantifikálták ezt a kulturális elfogultságot a LLM-ekben. Az emberi értékeket mérő különböző országokra vonatkozó felmérésekkel a következtetés az volt, hogy erősen összefüggők az amerikai kultúrával.

Ez a probléma nem csak a ChatGPT-ra korlátozódik. Még a DALL-E 3, egy képgeneráló modell is hasonló elfogultságokat mutat. A nyugati országokban készült képeken folytatott képzés alapján a DALL-E 3 olyan reggelit ábrázoló képeket generál, amelyek megfelelnek a nyugati kulturális normáknak.

A rejtett kulturális feltételezésekkel való foglalkozás érdekében kulcsfontosságú a képzési adatok kibővítése, hogy szélesebb körű különböző nyelveket és kulturális perspektívákat foglaljanak magukban. A változatosabb perspektívák beépítésével biztosíthatjuk, hogy a LLM-ek tükrözzék a világ szélesebb körű megértését és elkerüljék a elfogultságok továbbadását.

Gyakran Ismételt Kérdések:

K1: Mi az a nyelvi modellek?
A1: A nyelvi modellek mély tanuláson alapuló mesterséges intelligencia programok, amelyek képesek emberi jellegű szöveget generálni különböző témákban.

K2: Mi a probléma a kulturális feltételezésekkel a nyelvi modellekben?
A2: Az alapvető probléma az, hogy a nyelvi modellek, mint az OpenAI ChatGPT-je, túlnyomórészt angol szövegadatok alapján képződnek, ami kulturális elfogultságot és feltételezéseket eredményez az angol nyelvet beszélők, főként az Egyesült Államokbeliek tapasztalatai és perspektívái alapján.

K3: Hogyan jelentkeznek ezek a kulturális elfogultságok a nyelvi modellekben?
A3: Az elfogultságok megfigyelhetők abban, hogy a nyelvi modellek hogyan értelmezik egyes helyzeteket. Például a ChatGPT tévesen feltételezheti a takarékosságot vagy elégedetlenséget, ha egy madridi pár négy százalék borravalót ad egy étteremben, figyelmen kívül hagyva a spanyol nem borravalózás kulturális normáját.

K4: Sikerült kezelni ezeket az elfogultságokat?
A4: A folyamatos frissítések és képzések javították a ChatGPT kulturális különbségek figyelembevételére való képességét, de az elfogultságok továbbra is fennállnak. Például, ha egy történetet mutatnak be arról, hogy a vacsoravendégek 8:30-kor érkeznek, a ChatGPT spekulálhat a kések okai miatt, feltételezve egy észak-amerikai vacsora 6 órás standard időpontját.

K5: Más nyelvi modelleket is érintenek a kulturális elfogultságok?
A5: Igen, más nyelvi modellek, mint például a DALL-E 3, egy képgeneráló modell is hasonló elfogultságokat mutatnak. A nyugati országokban készült képek alapján a DALL-E 3 olyan reggelit ábrázoló képeket generál, amelyek megfelelnek a nyugati kulturális normáknak.

Meghatározások:

– LLM: Nyelvi Modellek.
– ChatGPT: Az OpenAI chatbotja, mély tanuláson alapuló mesterséges intelligenciával.
– DALL-E 3: Egy képgeneráló modell.
– Kulturális elfogultság: A nyelvi modellek tendenciája, hogy előnyben részesítsék vagy tükrözzék bizonyos csoportok kulturális perspektíváit és feltételezéseit, ebben az esetben az angolul beszélő kultúrákat és nyugati országokat.

Kapcsolódó linkek:

– OpenAI ChatGPT-je
– DALL-E
– Koppenhágai Egyetem
– Anthropic

The source of the article is from the blog lisboatv.pt