AIRI 本次发布的数据集 XLand-100B, XLand-100B是由AIRI和Tinkoff联合创建的大型多任务数据集,专为情境强化学习设计。该数据集包含近30,000个不同任务的完整学习历史,涵盖100亿次转换和25亿个情节,数据集大小为320GB。创建过程耗时50,000 GPU小时,远超多数学术实验室的能力。XLand-100B不仅支持广泛使用的情境学习强化学习方法,还提供了工具以复制或扩展数据集。此数据集旨在推动情境强化学习领域的研究,为构建通用智能体提供坚实基础,解决复杂任务多样性和难度的问题。
README 内容:
关于 arXiv , arXiv 是一个免费分发服务和开放获取的学术文章档案库,涵盖了物理学、数学、计算机科学、定量生物学、定量金融、统计学、电气工程和系统科学以及经济学等领域。该网站上的材料并未经过 arXiv 的同行评审。





_1769672084863.jpg)