Combinaison de différentes approches et stratégies : Renforcer la créativité dans les programmes d’échecs basés sur l’IA

Lorsque la Covid-19 a contraint les gens à rester chez eux l’année dernière, le scientifique informatique Tom Zahavy a redécouvert sa passion pour les échecs. Inspiré par la lecture des mémoires de Garry Kasparov, Zahavy s’est plongé dans des vidéos d’échecs et des films comme « Le Jeu de la Dame » pour alimenter son nouvel intérêt. Cependant, Zahavy a rapidement réalisé qu’il était plus doué pour les énigmes d’échecs que pour le jeu réel. Ces énigmes proposaient des scénarios artificiels défiant les joueurs de trouver des moyens innovants de prendre l’avantage.

Notamment, ces énigmes d’échecs ont mis en lumière les limites des programmes d’échecs traditionnels. Le mathématicien Sir Roger Penrose a créé une énigme en 2017 que même les programmes d’échecs informatiques les plus puissants ont échoué à résoudre correctement. Zahavy a reconnu que bien que les ordinateurs puissent surpasser les joueurs humains lors de parties régulières, ils peinaient à affronter des problèmes complexes en dehors de leurs données d’entraînement.

Zahavy, chercheur chez Google DeepMind, a saisi cette prise de conscience comme une opportunité pour explorer la résolution créative de problèmes dans les systèmes d’IA. Lui et son équipe ont développé une approche unique : combiner jusqu’à 10 systèmes d’IA de prise de décision optimisés pour différentes stratégies. Ils ont intégré AlphaZero de DeepMind, un puissant programme d’échecs, comme point de départ. En collaborant et en exploitant les forces de chaque système, le nouveau programme a surpassé AlphaZero seul et a démontré une compétence et une créativité accrues dans la résolution des énigmes de Penrose. Chaque fois qu’une approche rencontrait un obstacle, le programme passait de manière transparente à une autre.

Le succès de l’approche de Zahavy a fait résonance chez la scientifique informatique Allison Liemhetcharat. Elle a reconnu les avantages de l’utilisation de divers systèmes d’IA, en particulier dans des scénarios de résolution de problèmes au-delà des échecs. Liemhetcharat a souligné qu’avoir une équipe d’agents formés dans différents domaines accroît les chances de relever efficacement les défis difficiles.

Cette recherche indique que les systèmes d’IA peuvent bénéficier de la résolution collaborative de problèmes et de l’exploration de solutions multiples. Antoine Cully, chercheur en IA à l’Imperial College de Londres, l’a comparée à des séances de remue-méninges artificielles qui mènent à une résolution créative et efficace des problèmes. En recherchant des approches alternatives, les systèmes d’IA peuvent surmonter leurs limites et offrir des solutions novatrices.

Le travail de Zahavy aborde également les limites de l’apprentissage par renforcement, la base des puissants programmes d’échecs comme AlphaZero. Bien que l’apprentissage par renforcement permette aux systèmes d’IA d’apprendre et de s’améliorer par l’essai et l’erreur, il échoue souvent à développer une compréhension holistique du jeu. Zahavy a remarqué que ces systèmes avaient des angles morts lorsqu’il s’agissait de situations nouvelles ou de problèmes qu’ils n’avaient jamais rencontrés. L’incapacité à reconnaître l’échec entravait leur capacité à manifester de la créativité.

Pour l’avenir, la recherche de Zahavy encourage l’intégration de la reconnaissance de l’échec et de la résolution créative de problèmes dans les systèmes d’IA. De cette manière, les programmes d’IA peuvent surmonter les angles morts, étendre leurs capacités de résolution de problèmes et offrir des solutions plus nuancées.

FAQ sur les principaux sujets abordés dans l’article :

The source of the article is from the blog klikeri.rs

Privacy policy
Contact