首页站长资讯DeepMind新国际象棋AI系统AZdb吊打旧系统AlphaZero

DeepMind新国际象棋AI系统AZdb吊打旧系统AlphaZero

站长网2023-08-26 16:14:330阅

文章概要:

1. 谷歌DeepMind开发了一个集成系统AZdb（AlphaZero Db），将多个AlphaZero代理组合成一个“联盟”，以增强AI国际象棋能力并提高泛化能力。

2.AZdb代理使用行为多样性和响应多样性，创造独特下棋风格，更好适应不同对手和新局面。

3. 测试显示，AZdb解决两倍难题，ELO评分提高50分，优于旧版AlphaZero。

谷歌DeepMind开发了一个集成系统AZdb，将多个AlphaZero AI系统组合成一个“联盟”，以增强AI国际象棋能力并提高泛化能力。

DeepMind使用“行为多样性”和“响应多样性”技术，AZdb 的AI系统被训练以不同的方式下棋。根据Google Deepmind 的说法，行为多样性最大化了AI系统之间平均棋子位置的差异，而响应多样性则使AI系统面临针对不同对手的游戏。在实践中，这也意味着 AZdb 的AI系统将看到更多不同的位置，扩大分布数据的范围，这应该允许系统更好地泛化到看不见的位置。

研究人员让AZdb与旧版AlphaZero下棋，结果显示AlphaZero Db的ELO评分提高了50分，在解决困难的国际象棋谜题时成功解题数是AlphaZero的两倍。

这证明了多AI集成的优势，AZdb可以考虑更多可能性，更好地推广到未知棋局。

AlphaZero Db展现了更高的国际象棋水平和泛化能力，这是深度强化学习在游戏领域应用的一个重要进展。多样性的集成为AI的发展提供了新的思路。

DeepMind新国际象棋AI系统AZdb吊打旧系统AlphaZero

0000

评论列表

共(0)条