DeepMind 本次发布的数据集 Deep Mind Control Suite (DMControl), 该数据集提供了一系列连续控制环境,用于强化学习研究。该数据集被用于比较所提出的CRC-RL模型与现有最先进方法在不同DMControl环境中的性能。该数据集的规模包括100K和500K环境步骤,任务主要集中在强化学习领域。
查看Deep Mind Control Suite (DMControl)
README 内容:
关于 DeepMind , DeepMind是一家位于英国伦敦的人工智能公司,成立于2010年。该公司专注于开发能够模拟人类学习过程的算法,并在多个领域取得了显著成就,如AlphaGo在围棋比赛中战胜世界冠军。DeepMind于2014年被谷歌收购,现为Alphabet Inc.的子公司。
关于 arXiv , arXiv 是一个免费分发服务和开放获取的学术文章档案库,涵盖了物理学、数学、计算机科学、定量生物学、定量金融、统计学、电气工程和系统科学以及经济学等领域。该网站上的材料并未经过 arXiv 的同行评审。





_1769672084863.jpg)