Uus AI-tehnoloogia: Õppivad mängud simuleerivad elutruult

Uusimad edusammud tehisintellekti valdkonnas keskenduvad sellele, kuidas AI-mudelid õpivad mängima mitmeid 3D-mänge ja mõistavad verbaalseid juhiseid. Google Deepmindi loodud SIMA (skaleeritav juhitav multi-maailma agent) on olnud silmapaistev tänu oma võimele mängida mitmeid 3D-mänge inimlikult ning püüda mõista ja tegutseda verbaalsete juhendite alusel.

Erinevalt tüüpilistest NPC-dest (mittestsenaariumit tegelased) või AI-tegelastest mängudes, keda saab kaudselt kontrollida mängu käskude abil, ei oma SIMA juurdepääsu mängu sisekoodeksile ega reeglitele. Selle asemel on see treenitud kasutades tunde mänguvideoid, mida inimesed on loonud. Andmeesitajad lisavad märkmeid, mis aitavad mudelil seostada visuaalseid esitusi tegevustega, objektidega ja interaktsioonidega. Lisaks filmiti videod mängijatest, kes juhendavad üksteist mängus, et parandada õppimisprotsessi.

Näiteks võib SIMA õppida, et teatud pikslite liigutusmuster ekraanil vastab tegevusele “edasi liikumine”. Samamoodi, kui tegelane lähenenb ukse moodi objektile ja suhtleb uksenupu kujuga elemendiga, saab mudel aru, et ta “avab ukse”. Need õpitud seosed võimaldavad mudelil sooritada ülesandeid või sündmusi, mis ulatuvad lihtsast klahvide vajutamisest või objekti tuvastamisest kaugemale.

Treenimisvideod hõlmasid mitmeid mänge, sealhulgas Valheim ja Goat Simulator 3. Neis mängudes arendajad olid kaasatud ja andsid loa oma tarkvara kasutamiseks. Üheks peamiseks eesmärgiks uurijate seas oli välja selgitada, kas tehisintellekti treenimine ühes mängukategoorias võimaldab tal mängida teistes, mida ta pole varem kohanud, protsessi tuntakse kui üldistamine.

Vastus on jaatav, kuid teatud piirangutega. Masinõppeagendid, kes on koolitatud mitmele mängule, esinesid paremini, kui neid kokku puututi enne kohanud mängudega. Siiski võivad erinevad mehaanikad ja spetsiifilised terminid erinevates mängudes isegi hästi ettevalmistatud AI-mudeleid veel väljakutseid tekitada. Siiski, piisava koolitusandmetega, on potentsiaali, et mudel õpib ja kohaneb nende erinevustega.

Lisaks tehisintellekti õpil põhinevale agentsüsteemi valdkonna arendamisele püüavad uurijad luua loomulikumat ja koostöövalmimat mängukaaslast kui praegused jäigad, kõvapanelsed tegelased. Idee on lubada SIMA mängijad koos inimmängijatega, võimaldades neil anda juhiseid ja tegutseda meeskonnana.

Kuna SIMA tajub mängu ainult ekraanipiltidest, õpib ja kohaneb see sarnaselt inimestele. See kohanemisvõime võimaldab mudelil ilmutada esilekerkivaid käitumisi, lisades selle suhtlusele ettenägematuse elemendi.

Laialdaselt kasutatud meetod agendi tüüpi AI-de koolitamiseks on simuleerimisviis, kus järelevalveta mudel katsetab kiirendatud tempos 3D-simuleeritud maailmas. See võimaldab mudelil intuitiivselt õppida reegleid ja kavandada käitumist ilma ulatusliku märkusteta. Siiski erineb SIMA lähenemine sellest traditsioonilisest meetodist.

Tim Harley sõnul rely on projektijuhtidest üks, traditsiooniliselt simulaatorpõhine agentide koolitus tugineb tugevustunde õppimisele, mis nõuab mängult või keskkonnalt tasu signaali. Ent niisuguse tasu signaali hindamine igale võimalikule eesmärgile mitmetes mängudes ei ole teostatav. Selle asemel on SIMA treenitud inimeste käitumise jäljendamise abil, mille eesmärgid on kirjeldatud tekstina. See lähenemine võimaldab mudelil järgida mitmesuguseid ülesandeid, olles piiratud range tasu struktuuriga.

Ettevõtted uurivad sarnaseid avatud koostöö ja loomise lähenemisviise. Näiteks uuritakse vestlusi mängudes mängijatega, et kasutada LLM-tüüpi juturoboteid. Lisaks toovad AI-uuringud improviseerimise ja simuleeritud interaktsioonide uurimise mängudele huvitavaid tulemusi.

Kuigi eksperimendid lõpmatutes mängudes nagu MarioGPT pakuvad veel üht uurimisvõimalust, on fookus endiselt Deepmindi SIMA-l ning selle võimel õppida ja kohaneda mitmete 3D-mängudega, pakkudes loomulikumat ja interaktiivsemat mängukogemust.

KKK:

1. Mis on SIMA?
SIMA tähistab skaleeritavat juhitavat multi-maailma agenti, mis on Google Deepmindi loodud süvaõppimise mudel. See õpib mängima mitmeid 3D-mänge inimese moodi ja püüab mõista ja tegutseda verbaalsete juhiste alusel.

2. Kuidas SIMA on treenitud?
SIMA on treenitud kasutades tunde mänguvideoid, mida on loonud inimesed. Andmeesitajad lisavad märkmeid, et aidata mudelil seostada visuaalseid esitusi tegevustega, objektidega ja interaktsioonidega. Videoid mängijatest, kes omavahel mängus juhendavad, on samuti filmitud õppimisprotsessi täiustamiseks.

3. Kas SIMA saab mängida mänge, mida ta pole varem kohanud?
Jah, tehisintellekti agendid, kes on koolitatud mitmele mängule, esinesid paremini, kui neid pandi kokku puutuma mänge, mida nad ei olnud varem kohanud. Siiski võivad erinevad mehaanikad ja spetsiifilised terminid teistes mängudes siiski pakkuda väljakutseid AI-mudelitele.

4. Mis on SIMA taga olevate uurijate eesmärk?
Uurijad püüavad luua loomulikumat ja koostöövalmimat mängukaaslast kui praegused jäigad, kõvapanelsed tegelased. Nad soovivad, et SIMA saaks mängida koos inimmängijatega, lubades neil anda juhiseid ja töötada meeskonnana.

5. Kuidas SIMA tajub mängu?
SIMA tajub mängu ainult ekraanipiltidest, sarnaselt inimestele. See õpib ja kohaneb samaaegselt inimestega, ilmutades esilekerkivaid käitumisi ja lisades oma suhtlusele ettenägematuse elemendi.

6. Kuidas SIMA erineb traditsioonilisest simulaatorpõhisest agendi koolitusest?
Traditsiooniline simulaatorpõhine agendi koolitus toetub tugevustunde õppimisele, mis nõuab mängult või keskkonnalt tasu signaali. SIMA puhul koolitatakse aga mudelit inimeste käitumise jäljendamise abil, mille eesmärgid on tekstipõhiselt kirjeldatud. See lähenemine lubab mudelil järgida mitmesuguseid ülesandeid, olles piiratud range tasu struktuuriga.

Olulised Terminid ja Sõnavara:
– NPCs: Mitteduolijad, viidates AI-tegelastele mängudes.
– Üldistamine: Võimekus tehisintellekti treeningul ühes mängude rühmas mängida teisi, mida pole varem kogetud.
– Tugevustundeline Õppimine: Tüüp masinõppimisest, kus agent õpib võtma tegevusi keskkonnas eesmärgiga need maksimeerida.

The source of the article is from the blog elblog.pl

Privacy policy
Contact