Nový prístup v umelom intelekte: Virtuálne prostredie premýšľa inak

V nedávnom článku sme sa dozvedeli o revolučnom pokroku v oblasti umelého inteligentného agenta, ktorý úspešne ovláda rôzne úlohy vo virtuálnych prostrediach 3D hier, s ktorými sa doteraz nikdy nestretol. Tento úspech, predstavený výskumným laboratóriom DeepMind, predstavuje novú éru adaptability umelých agentov v hernom svete.

DeepMind, známe výskumné laboratórium v oblasti umelej inteligencie, sa doteraz zameriavalo predovšetkým na vývoj modelov umelej inteligencie pre stratégické hry ako Go a šachy, ako aj na učenie hier bez explicitného pravidelného inštruktažu. Nový úspech však dokazuje, že umelý agent SIMA, schopný pochopiť rôzne herné prostredia a vykonávať úlohy na základe prirodzených jazykových inštrukcií, je mimoriadne efektívny.

Pre dosiahnutie tohto úspechu DeepMind spolupracovalo s hernými štúdiami ako Hello Games, Tuxedo Labs a Coffee Stain a trénovalo svojho Scalable Instructable Multiworld Agent (SIMA) na rôznorodom sade deviatich hier. Okrem týchto hier výskumníci využili štyri výskumné prostredia, vrátane Unity-based prostredia, kde boli agenti usmerňovaní ku tvorbe soch pomocou stavebných blokov. Vďaka tomuto komplexnému prístupu bol SIMA vystavený širokej škále vizuálnych štýlov a perspektív, ktoré sa pohybujú od pohľadu z prvej osoby po pohľad z tretej osoby.

Každá hra v SIMA portfolio ponúka jedinečný interaktívny svet s vlastným súborom zručností na ovládanie, vrátane navigácie, ťažby zdrojov, ovládania vesmírneho lode a výroby predmetov. Výskumníci z DeepMind zdôraznili, že získanie zručností pri nasledovaní pokynov a vykonávaní úloh v rôznych videoherných prostrediach môže otvoriť cestu pre rozvoj adaptabilných umelej inteligencie, schopnej efektívne pracovať v akomkoľvek prostredí.

Pre tréning SIMA výskumníci pozorovali ľudskú hru a zaznamenali príslušné klávesnice a myši použité na vykonávanie akcií. Tieto údaje boli následne využité na tréning SIMA, ktorý využíva „presné mapovanie obrázkov a jazyka a video model predvídateľní na obrazovke akcií.“ V dôsledku toho má SIMA schopnosť pochopiť rôzne prostredia a vykonávať úlohy na dosiahnutie konkrétnych cieľov.

Tým, čo SIMA oddeľuje, je to, že nevyžaduje prístup k zdrojovému kódu alebo API hry; môže fungovať na komerčných verziách hier s použitím len dvoch vstupov: vizuálne na obrazovke a užívateľské pokyny. Používaním rovnakého metódu vstupu ako ľudia – klávesnica a myš – DeepMind tvrdí, že SIMA môže fungovať vo virtuálnom prostredí takmer akejkoľvek hry.

Hodnotenie výkonu SIMA sa zameriava na stovky základných zručností, ktoré je možné vykonať v krátkych časových rámcoch, a to cez kategórie, ako sú navigácia („otoč sa doprava“), interakcia s objektmi („zbieraj huby“) a úlohy založené na menu, ako je otvorenie mapy alebo výroba predmetu. Ultimatívnym cieľom DeepMind je umožniť agentom vykonávať zložitejšie, viacetapové úlohy na základe prirodzených jazykových povolaní, ako je „nájsť zdroje a postaviť tábor.“

Čo sa týka výkonu, SIMA preukázala sľubné výsledky v rámci viacerých kritérií tréningu. Zvlášť agent trénovaný na všetkých deviatich hrách významne prekonával agenta, ktorý bol trénovaný len v jednej hre. Navyše agent trénovaný na osem hier sa takmer tak dobre ako agent trénovaný výhradne na deviatej hre, čo dokazuje schopnosť SIMA generalizovať mimo svoj tréning.

Avšak, preto aby SIMA dosiahla skutočný úspech, je dôležitý jazykový vstup. V testoch, kde agenti nedostávali jazykový tréning alebo inštrukcie, SIMA prejavila bezcieľne správanie, pričom uprednostňovala bežné akcie ako zber zdrojov namiesto nasledovania konkrétnych pokynov. Toto potvrdzuje dôležitú úlohu porozumenia jazyka pri efektívnom vedení umelých agentov.

DeepMind uznáva, že tento výskum je stále vo svojich začiatočných štádiách a hoci výsledky sú sľubné, je potrebný ďalší rozvoj na zlepšenie výkonu a generalizovateľnosti SIMA. Tím predpokladá budúce verzie agenta, ktoré zlepšia jeho porozumenie a schopnosti vykonávať zložitejšie úlohy. Nakoniec, DeepMind si kládne za cieľ vyvinúť umele-inteligentné systémy, ktoré budú schopné bezpečne a efektívne vykonávať širokú škálu úloh, pričom pomáhajú jednotlivcom online aj v reálnych situáciách.

Často kladené otázky:

Q: Čo je SIMA?
A: SIMA znamená Scalable Instructable Multiworld Agent, umele-inteligentný agent vyvinutý DeepMind, ktorý preukazuje zručnosť pri vykonávaní rôznych úloh vo 3D hrách na základe prirodzených jazykových inštrukcií.

Q: Ako SIMA učí vykonávať úlohy v rôznych hrách?
A: DeepMind trénoval SIMA pozorovaním ľudskej hry a zaznamenaním príslušných klávesníc a myši použitej na vykonávanie akcií. Tieto údaje boli použité na trénovanie SIMA, ktorý používa presné mapovanie obrazov a jazyka a video model na predpovedanie akcií na obrazovke.

Q: Potrebuje SIMA prístup k zdrojovému kódu alebo API hry?
A: Nie, SIMA nepotrebuje prístup k zdrojovému kódu alebo API hry. Funguje na komerčných verziách hier s použitím len vizuálov na obrazovke a užívateľských inštrukcií.

Q: Aké sú konečné ciele tohto výskumu?
A: Konečné ciele tohto výskumu sú vyvinúť umele-inteligentných agentov, ktorí môžu efektívne vykonávať úlohy na základe prirodzených jazykových povolaní a pracovať efektívne v rôznych virtuálnych prostrediach, čo nakoniec pomôže ľuďom online aj v reálnych situáciách.

Q: Ako vplýva porozumenie jazyka na výkon SIMA?
A: Porozumenie jazyka je nevyhnutné pre SIMA, aby úspešne vykonával úlohy. Testy bez jazykového tréningu alebo inštrukcií skončili bezcieľným správaním SIMA, čo zdôrazňuje dôležitosť jazykového vstupu pri vedení akcií SIMA.

Q: Na aké hry bol SIMA trénovaný?
A: SIMA bol trénovaný na rôznorodom sade deviatich hier, vrátane hier z rôznych žánrov a vizuálnych štýlov.

Q: Ako generalized SIMA svoj tréning na nové hry?
A: SIMA ukázala schopnosť generalizovať mimo svoj tréning tým, že sa dobre vysporiadala s hrami, na ktoré nebola špeciálne vytrénovaná. To demonštruje jeho adaptabilitu a zručnosť v rôznych herných prostrediach.

Q: Aké sú niektoré príklady úloh, ktoré SIMA môže vykonávať v hrách?
A: SIMA môže vykonávať úlohy, ako je navigácia, ťažba zdrojov, ovládanie vesmírneho lode a výroba predmetov v rôznych hrách.

Q: Ako DeepMind trénuje SIMA na pochopenie prirodzených jazykových povolaní?
A: DeepMind trénoval SIMA pozorovaním ľudskej hry a zaznamenaním príslušných klávesníc a myši použitej na vykonávanie akcií. Tieto údaje boli potom využité na tréning SIMA na pochopenie prirodzených jazykových inštrukcií.

Q: Aké sú obmedzenia výkonu SIMA bez jazykového vstupu?
A: Bez jazykového tréningu alebo inštrukcií SIMA prejavovala bezcieľné správanie, uprednostňujúc bežné akcie namiesto nasledovania konkrétnych pokynov. Toto zdôrazňuje dôležitosť porozumenia jazyku pri vedení akcií SIMA.

Pre ďalšie informácie navštívte oficiálnu webovú stránku DeepMind: deepmind.com

The source of the article is from the blog radardovalemg.com