Txing

欢迎来到 | 伽蓝之堂

0%

Deepmind的Agent57是第一个在57款Atari游戏上全面超过人类水平的强化学习智能体。但是Agent57的数据利用效率很低,要求80亿帧数据。本文通过设置不同的策略集合实现了200倍的训练效率提高。