结合不同方法和策略：提升AI国际象棋程序的创造力

2020年，当Covid-19迫使人们待在家里时，计算机科学家汤姆·扎哈维重新发现了他对国际象棋的热情。受到读到加里·卡斯帕罗夫的回忆录的启发，扎哈维沉浸在象棋视频和电影中，比如《皇后的谋杀》这样的电影，以滋养他新发现的兴趣。然而，扎哈维很快意识到自己在象棋拼图方面比实际游戏更擅长。这些拼图提出了人工场景，挑战玩家们寻找获取优势的创新方法。

值得注意的是，这些象棋拼图帮助揭示了传统象棋程序的局限性。数学家罗杰·彭罗斯在2017年设计了一个拼图，即便是最强大的计算机国际象棋程序也未能正确解决。扎哈维意识到，虽然计算机在常规游戏中能超越人类玩家，但它们在处理超出训练数据的复杂问题时遇到困难。

作为Google DeepMind的研究科学家，扎哈维将这一认识视为探索AI系统中创造性问题解决的机会。他和他的团队开发了一种独特的方法：结合多达10个为不同策略优化的决策AI系统。他们将DeepMind的AlphaZero，一个强大的象棋程序，作为起点。通过合作和利用每个系统的优势，新程序的表现超过了单独使用AlphaZero，并展现出了在解决彭罗斯拼图时增强的技能和创造力。每当一种方法遇到障碍时，程序会平稳地过渡到另一种方法。

扎哈维的方法的成功 resonated 让计算机科学家艾莉森·利姆赫塔恰特。她承认了使用多样化AI系统的优势，特别是在超出象棋问题解决情景方面。利姆赫塔恰特强调，拥有在不同领域接受训练的代理团队会增加有效解决困难挑战的机会。

这项研究表明，AI系统可以从协作解决问题和探索多种解决方案中获益。伦敦帝国理工学院的AI研究人员安托万·库利将其比作人工头脑风暴会话，导致创造性和高效的问题解决。通过寻求替代方法，AI系统可以克服他们的局限性，提供创新解决方案。

扎哈维的工作还解决了强化学习的局限性，这是强大象棋程序（如AlphaZero）背后的基础。尽管强化学习允许AI系统通过反复试验学习和改进，但它经常无法全面理解游戏。扎哈维注意到，这些系统在面对新颖情况或从未遇到的问题时存在盲点。未能识别失败会妨碍它们展现创造力的能力。

展望未来，扎哈维的研究鼓励在AI系统中整合失败识别和创造性问题解决。通过这样做，AI程序可以克服盲点，扩展其解决问题的能力，并提供更细致的解决方案。

FAQ基于文章中提到的主要话题和信息：

Q：是什么激发了计算机科学家汤姆·扎哈维重新发现他对国际象棋的热情？
A：汤姆·扎哈维在Covid-19封锁期间受到读加里·卡斯帕罗夫的回忆录和观看象棋视频以及《皇后的谋杀》等电影的启发。

Q：扎哈维对国际象棋拼图和传统象棋程序有什么认识？
A：扎哈维意识到象棋拼图帮助揭示了传统象棋程序的局限性。计算机可以在常规游戏中超越人类玩家，但它们在处理超出训练数据的复杂问题时遇到困难。

Q：扎哈维和他的团队如何解决AI系统中的创造性问题解决方法？
A：扎哈维和他的团队结合了多达10个为不同策略优化的决策AI系统。他们以DeepMind的AlphaZero为起点，利用每个系统的优势创造了一个胜过AlphaZero单独的新程序。

Q：在扎哈维的方法中，合作的作用是什么？
A：合作在扎哈维的方法中至关重要。当一种方法遇到障碍时，程序会平稳过渡到另一种方法，使团队能够结合不同系统的优势。

Q：计算机科学家艾莉森·利姆赫塔见到使用多样化AI系统有哪些优势？
A：利姆赫塔强调，在不仅仅是在象棋中，而是超越象棋的问题解决情境中，训练在不同领域的多样化AI系统会增加有效解决困难挑战的机会。

Q：研究显示了AI系统和问题解决方法的什么情况？
A：研究显示了AI系统可以从协作问题解决和探索多种解决方案中获益。寻求替代方法让他们克服局限性，提供创新解决方案。

Q：扎哈维的工作解决了强化学习中的什么局限性？
A：扎哈维的工作解决了强化学习的局限性，这是象AlphaZero这样的强大象棋程序背后的基础。这些系统往往在面对新颖情况或从未遇到的问题时存在盲点。

Q：扎哈维建议如何克服AI系统中的这些局限性？
A：扎哈维建议在AI系统中整合失败识别和创造性问题解决。通过这样做，AI程序可以克服盲点，扩展其解决问题的能力，并提供更细致的解决方案。

关键术语/行话：
– AlphaZero：由DeepMind开发的利用人工智能进行游戏的强大象棋程序。
– 强化学习：一种机器学习类型，AI系统通过反复试验学习，接收反馈并相应调整其行动。

建议的相关链接：
– DeepMind的AlphaGo
– 伦敦帝国理工学院

The source of the article is from the blog trebujena.net