南京大学 本次发布的数据集 ImagineBench, ImagineBench是一个用于评估离线强化学习算法的数据集,它包含由环境收集的真实回放和大型语言模型生成的虚拟回放。数据集覆盖了运动、机器人操作和导航等多个领域,并提供了不同复杂程度的自然语言任务指令,以促进语言条件策略的学习。ImagineBench旨在解决强化学习算法在未见过的任务上表现不佳的问题,为未来的研究提供了方向,包括更好地利用虚拟回放、快速在线适应和持续学习,以及扩展到多模态任务。
README 内容:
关于 南京大学 , 南京大学是中国的一所著名综合性研究型大学,位于江苏省南京市。学校成立于1902年,具有悠久的历史和深厚的文化底蕴,是中国高等教育的摇篮之一。在软件新技术和人工智能领域,南京大学都有显著的研究成果和学术贡献。
关于 arXiv , arXiv 是一个免费分发服务和开放获取的学术文章档案库,涵盖了物理学、数学、计算机科学、定量生物学、定量金融、统计学、电气工程和系统科学以及经济学等领域。该网站上的材料并未经过 arXiv 的同行评审。





_1769672084863.jpg)