Introduktion til Dyb AI i Spil: DeepMind Præsenterer Effektiv AI-agent for Forskellige Virtuelle Miljøer

DeepMind, det anerkendte AI-forskningslaboratorium, har for nylig fremlagt banebrydende forskning, der viser en AI-agent, der er i stand til at excellere i forskellige opgaver inden for 3D-spil, som den aldrig har stødt på før. Mens DeepMind tidligere har fokuseret på at udvikle AI-modeller til strategiske spil som Go og skak, samt læringsspil uden eksplicitte regelinstruktioner, demonstrerer denne nye præstation AI-agentens dygtighed i at forstå forskellige spillemiljøer og udføre opgaver baseret på naturligt sprog.

For at opnå denne bedrift samarbejdede DeepMind med spilstudier som Hello Games, Tuxedo Labs og Coffee Stain og trænede deres Skalérbare Instruerbare Multiworld Agent (SIMA) på en forskelligartet sæt på ni spil. Ud over disse spil udnyttede forskerne fire forskningsmiljøer, herunder et Unity-baseret miljø, hvor agenter blev instrueret i at skabe skulpturer ved hjælp af byggeklodser. Gennem denne omfattende tilgang blev SIMA – en AI-agent designet til 3D virtuelle miljøer – præsenteret for et bredt spektrum af visuelle stilarter og perspektiver, der spænder fra førstepersons- til tredjepersonsvisninger.

Hvert spil inden for SIMA’s portefølje præsenterer en unik interaktiv verden med sine egne færdigheder at mestre, herunder navigation, ressourceudvinding, rumskibspilning og genstandshåndværk. Forskerne hos DeepMind understregede, at opnåelse af dygtighed i at følge instruktioner og fuldføre opgaver på tværs af forskellige videospilmiljøer kan bane vejen for udviklingen af mere tilpasningsdygtige AI-agenter, der er i stand til at operere effektivt i enhver indstilling.

For at træne SIMA observerede forskerne menneskelig gameplay og optog de tilsvarende tastatur- og museinput, der blev brugt til at udføre handlinger. Disse data blev derefter brugt til at træne SIMA, som udnytter “præcis billede-sprog-mapping og en videomodel, der forudsiger handlinger på skærmen.” Følgelig har SIMA evnen til at forstå forskellige miljøer og udføre opgaver for at opnå specifikke mål.

Det, der adskiller SIMA, er, at den ikke kræver adgang til et spils kildekode eller API; den kan fungere på kommercielle versioner af spil ved kun at bruge to inputs: on-screen visualer og brugerinstruktioner. Ved at anvende den samme inputmetode som mennesker – tastatur og mus – hævder DeepMind, at SIMA kan fungere i stort set ethvert virtuelt miljø.

Evalueringen af SIMA’s præstation fokuserer på hundredvis af grundlæggende færdigheder, der kan udføres inden for korte tidsrammer, på tværs af kategorier som navigation (“drej til højre”), objektinteraktion (“saml svampe”) og menu-baserede opgaver såsom at åbne et kort eller lave et objekt. DeepMinds ultimative mål er at muliggøre, at agenter udfører mere komplekse, flertrinsopgaver baseret på naturligt sprog, såsom “find ressourcer og byg en lejr.”

Med hensyn til præstationer har SIMA vist lovende resultater på tværs af flere træningskriterier. Bemærkelsesværdigt overgik en agent trænet på alle ni spil markant en agent trænet på kun ét spil. Desuden klarede en agent, der blev trænet på otte spil, sig næsten lige så godt som en agent, der udelukkende blev trænet på det niende spil, hvilket viser SIMA’s evne til at generalisere ud over sin træning.

Imidlertid for at SIMA kan opnå sand succes, er sproginput afgørende. I test, hvor agenter ikke fik sprogtræning eller instruktioner, udviste SIMA formålsløs adfærd og prioriterede almindelige handlinger som at indsamle ressourcer i stedet for at følge specifikke instruktioner. Dette bekræfter den afgørende rolle, som sprogforståelse spiller i at guide AI-agenter.

DeepMind erkender, at denne forskning stadig er i sin spæde start, og selvom resultaterne er lovende, er yderligere udvikling nødvendig for at forbedre SIMA’s præstationer og generaliserbarhed. Holdet forestiller sig fremtidige iterationer af agenten, der vil forbedre dens forståelse og evne til at udføre mere komplekse opgaver. Endelig har DeepMind til formål at udvikle AI-systemer, der sikkert og effektivt kan udføre en bred vifte af opgaver, der kan hjælpe enkeltpersoner både online og i virkelige scenarier.

Ofte stillede spørgsmål:

The source of the article is from the blog qhubo.com.ni

Privacy policy
Contact