DeepMind AI MuZero可以学习和掌握国际象棋围棋雅达利

2020-12-24 15:27:56 编辑：来源：

导读今天，《自然》杂志上的一篇专题研究论文详细介绍了机器学习算法MuZero。MuZero扩展了AlphaGo，AlphaGo Zero和AlphaZero等系统的功能。每

今天，《自然》杂志上的一篇专题研究论文详细介绍了机器学习算法MuZero。MuZero扩展了AlphaGo，AlphaGo Zero和AlphaZero等系统的功能。每种新算法都使智能机器在掌握游戏方面变得更好，从Go开始，然后是Chess和Shogi，现在是Atari!

什么是MuZero?

MuZero是一种机器学习算法。算法是计算机在需要学习新信息和/或对新信息采取行动时遵循的一组规则。当MuZero用于具有机器学习功能的计算机上时，它就可以学习游戏和大师级游戏，例如Go和Chess。

创建像MuZero这样的算法的过程很重要，因为它可以导致机器学习和人工智能能够处理比过去任何计算机都无法破解的先进的现实世界问题。

AlphaGo，AlphaGo零，AlphaZero

AlphaGo算法于2016年公开发布，似乎是第一个掌握GO *游戏的程序。* AlphaGo使用神经网络和树搜索掌握了Go。它要求先植入人类数据和领域知识，然后才能尝试掌握Go。

在2017年，AlphaGo Zero系统超越了第一次迭代，现在能够在不增加人类数据和/或领域知识的情况下学习玩Go。快进到2018年，AlphaZero超越了前两个版本，掌握了Go，Chess和Shogi。同一小组中发布了其他小组的最新算法称为MuZero。

MuZero也可以学习

前三个发行版中的每个发行版都需要为每个游戏预先植入一套规则，然后将其继续掌握。在2020年末，名为MuZero的系统取得了重大飞跃。该算法现在不需要预先植入的规则集-它可以实时学习所述规则。

MuZero既可以学习将要玩的游戏规则，又可以掌握所说的游戏。正如其创造者所说的那样，“ MuZero可以学习游戏规则，还可以掌握动态未知的环境。”

正如本周发表的研究指出的那样，“当在Go，国际象棋和将棋上进行评估(用于高性能计划的典型环境时)，MuZero算法在没有任何游戏动态知识的情况下与所提供的AlphaZero算法的超人性能相匹配。遵守游戏规则。”

Atari作为证明

研究人员表明，MuZero能够学习围棋，国际象棋和将棋的规则，然后掌握这些游戏(同样，无需预先植入规则)。此外，MuZero还针对57种不同的Atari电子游戏进行了测试。MuZero能够学习一套Atari游戏的规则并掌握大师所说的游戏!

正如本周发表的研究报告所述，当在57种不同的Atari游戏上进行测试时，“当在57种不同的Atari游戏上进行评估时-MuZero算法是一种经典的视频游戏环境，用于测试人工智能技术，在这种环境中，基于模型的规划方法历来都在挣扎达到了最先进的性能。”

标签： DeepMindAIMuZero

免责声明：本文由用户上传，如有侵权请联系删除！