DeepMind研发了一个名为AZdb的集成系统,将多个AlphaZero AI系统组合成一个“联盟”,以增强AI国际象棋能力并提高泛化能力。该系统利用行为多样性和响应多样性技术,训练AI系统以不同的方式下棋。研究人员让AZdb与旧版AlphaZero下棋,结果显示AZdb的ELO评分提高了50分,在解决困难的国际象棋谜题时成功解题数是AlphaZero的两倍。这证明了多AI集成的优势,AZdb可以考虑更多可能性,更好地推广到未知棋局。AlphaZero Db展现了更高的国际象棋水平和泛化能力,这是深度强化学习在游戏领域应用的一个重要进展。多样性的集成为AI的发展提供了新的思路。