Zjednotenie Rôznych Prístupov a Stratégií: Zlepšovanie Kreativity v AI Šachových Programoch

Keď Covid-19 minulý rok donútil ľudí zostať doma, počítačový vedec Tom Zahavy znovuobjavil svoju vášeň pre šach. Inšpirovaný čítaním memoárov Garryho Kasparova, Zahavy sa ponoril do šachových videí a filmov ako „The Queen’s Gambit“, aby posilnil svoj nový záujem. Avšak Zahavy čoskoro spozoral, že je zručnejší v riešení šachových hádaniek než v samotnej hre. Tieto hádanky predstavovali umele vytvorené situácie, ktoré vyzývali hráčov hľadať inovatívne spôsoby, ako získať výhodu.

Významne tieto šachové hádanky pomohli ukázať obmedzenia tradičných šachových programov. Matematik Sir Roger Penrose vytvoril hádanku v roku 2017, ktorú ani najsilnejšie počítačové šachové programy nedokázali správne vyriešiť. Zahavy si uvedomil, že zatiaľ čo počítače môžu prekonať ľudských hráčov v bežnej hre, zápili sa pri riešení zložitých problémov mimo svojich tréningových dát.

Zahavy, vedec výskumnej skupiny Google DeepMind, vnímal túto realizáciu ako príležitosť na preskúmanie tvorivého riešenia problémov v AI systémoch. On a jeho tím vyvinuli jedinečný prístup: zlúčenie až 10 rozhodovacích AI systémov optimalizovaných pre rôzne stratégie. Integrovali DeepMind’s AlphaZero, mocný šachový program, ako východiskový bod. Spolupracujúc a využívajúc silné stránky každého systému, nový program prevýšil AlphaZero sám o sebe a preukázal zvýšenú zručnosť a kreativitu pri riešení Penroseových hádaniek. Vždy, keď jedna stratégia narazila na prekážku, program sa hladko prepnul na inú.

Úspech Zahavého prístupu rezonoval s počítačovým vedcom Allison Liemhetcharat. Uznala výhody použitia rôznych AI systémov, najmä v riešení problémových situácií mimo šachu. Liemhetcharat zdôraznila, že mať tím agentov vyškolených v rôznych oblastiach zvyšuje šance na efektívne riešenie ťažkých výziev.

Táto výskumná práca naznačuje, že AI systémy môžu profitovať z kooperatívneho riešenia problémov a skúmania viacerých riešení. Antoine Cully, výskumník AI na Imperial College London, to porovnal s umele vytvorenými brainstormingovými schôdzkami, ktoré vedú k tvorivému a efektívnemu riešeniu problémov. Hľadaním alternatívnych prístupov môžu AI systémy prekonať svoje obmedzenia a priniesť inovatívne riešenia.

Práca Zahavého tiež rieši obmedzenia v učení z posilňovania, základe silných šachových programov ako AlphaZero. Aj keď učenie z posilňovania umožňuje AI systémom učiť sa a zlepšovať prostredníctvom skúšok a chýb, často zlyháva v rozvoji holistického porozumenia hre. Zahavy si všimol, že tieto systémy mali slepé miesta, pokiaľ išlo o nové situácie alebo problémy, s ktorými sa ešte nikdy nestretli. Nedostatok schopnosti rozpoznať neúspech bránil ich schopnosti prejaviť kreativitu.

Ďalej Zahavého výskum podporuje integráciu rozpoznávania zlyhania a tvorivého riešenia problémov v AI systémoch. Týmto spôsobom môžu AI programy prekonať slepé miesta, rozšíriť svoje schopnosti riešenia problémov a ponúknuť nuansovanejšie riešenia.

The source of the article is from the blog enp.gr