Gecombineerde benaderingen en strategieën: het verbeteren van creativiteit in AI Schaakprogramma's

Toen Covid-19 mensen vorig jaar dwong om thuis te blijven, herontdekte computerwetenschapper Tom Zahavy zijn passie voor schaken. Geïnspireerd door het lezen van de memoires van Garry Kasparov, dompelde Zahavy zich onder in schaakvideo’s en films zoals “The Queen’s Gambit” om zijn hernieuwde interesse te voeden. Zahavy besefte al snel dat hij meer bedreven was in schaakpuzzels dan in daadwerkelijk spel. Deze puzzels creëerden kunstmatige scenario’s die spelers uitdaagden om innovatieve manieren te vinden om een voordeel te behalen.

Opmerkelijk genoeg hielpen deze schaakpuzzels om de beperkingen van traditionele schaakprogramma’s aan het licht te brengen. Wiskundige Sir Roger Penrose ontwierp in 2017 een puzzel die zelfs de sterkste computergestuurde schaakprogramma’s niet correct konden oplossen. Zahavy erkende dat hoewel computers menselijke spelers konden overtreffen in reguliere gameplay, ze moeite hadden met het aanpakken van complexe problemen buiten hun trainingsdata.

Zahavy, een onderzoeker bij Google DeepMind, zag dit inzicht als een kans om creatieve probleemoplossing in AI-systemen te verkennen. Hij en zijn team ontwikkelden een unieke benadering: het combineren van maximaal 10 besluitvormende AI-systemen die geoptimaliseerd zijn voor verschillende strategieën. Ze integreerden DeepMind’s AlphaZero, een krachtig schaakprogramma, als startpunt. Door samen te werken en te profiteren van de sterke punten van elk systeem, presteerde het nieuwe programma beter dan AlphaZero alleen en toonde het een verhoogde vaardigheid en creativiteit bij het oplossen van Penrose’s puzzels. Telkens wanneer een benadering een obstakel tegenkwam, maakte het programma naadloos de overgang naar een andere benadering.

Het succes van Zahavy’s benadering sprak ook computerwetenschapper Allison Liemhetcharat aan. Ze erkende de voordelen van het gebruik van diverse AI-systemen, vooral in probleemoplossingsscenario’s die verder gaan dan schaken. Liemhetcharat benadrukte dat het hebben van een team van agenten die getraind zijn in verschillende domeinen de kans vergroot om moeilijke uitdagingen effectief aan te pakken.

Dit onderzoek geeft aan dat AI-systemen baat kunnen hebben bij samenwerkende probleemoplossing en het verkennen van meerdere oplossingen. Antoine Cully, een AI-onderzoeker aan het Imperial College London, vergeleek het met kunstmatige brainstormsessies die leiden tot creatieve en efficiënte probleemoplossing. Door alternatieve benaderingen te zoeken, kunnen AI-systemen hun beperkingen overwinnen en innovatieve oplossingen bieden.

Het werk van Zahavy adresseert ook de beperkingen van reinforcement learning, de basis van krachtige schaakprogramma’s zoals AlphaZero. Hoewel reinforcement learning AI-systemen in staat stelt te leren en verbeteren door vallen en opstaan, slaagt het er vaak niet in een holistisch begrip van het spel te ontwikkelen. Zahavy merkte op dat deze systemen blinde vlekken hadden als het ging om nieuwe situaties of problemen die ze nog nooit eerder hadden meegemaakt. Het onvermogen om mislukkingen te herkennen belemmerde hun vermogen om creativiteit tentoon te spreiden.

Vooruitkijkend moedigt het onderzoek van Zahavy de integratie aan van het herkennen van mislukkingen en creatieve probleemoplossing in AI-systemen. Op die manier kunnen AI-programma’s blinde vlekken overwinnen, hun probleemoplossend vermogen vergroten en meer genuanceerde oplossingen bieden.

The source of the article is from the blog regiozottegem.be