Soft Actor-Critic 本次发布的数据集 Walker2d Dataset, 该数据集包含了由训练后的软演员-评论家(Soft Actor-Critic,简称SAC)智能体生成的样本,其中专家行为和高性能行为的样本数量相等。此外,该数据集的配置受到了D4RL基准中为离线强化学习构建数据集方式的启发。该数据集规模大约为100万个样本,任务领域为强化学习。
README 内容:
关于 Soft Actor-Critic , -
关于 arXiv , arXiv 是一个免费分发服务和开放获取的学术文章档案库,涵盖了物理学、数学、计算机科学、定量生物学、定量金融、统计学、电气工程和系统科学以及经济学等领域。该网站上的材料并未经过 arXiv 的同行评审。





_1769672084863.jpg)