DeepMind 本次发布的数据集 Alchemy, Alchemy是一个由DeepMind创建的3D视频游戏环境,用于元强化学习研究的基准测试。该数据集包含167424种可能的化学组合,每种组合都涉及一个潜在的因果结构,该结构在每次游戏时都会程序化地重新采样,从而允许进行结构学习、在线推理、假设测试和基于抽象领域知识的动作排序。Alchemy旨在通过其透明和可深入分析的结构丰富性,为元RL研究提供一个具有挑战性的基准。此外,Alchemy还提供了一套分析工具和样本代理轨迹,以帮助研究人员评估和改进元学习算法。
README 内容:
关于 DeepMind , DeepMind是一家位于英国伦敦的人工智能公司,专注于开发先进的机器学习算法和人工智能技术,尤其在强化学习和神经网络领域有显著贡献。
关于 arXiv , arXiv 是一个免费分发服务和开放获取的学术文章档案库,涵盖了物理学、数学、计算机科学、定量生物学、定量金融、统计学、电气工程和系统科学以及经济学等领域。该网站上的材料并未经过 arXiv 的同行评审。





_1769672084863.jpg)