Real-World Reinforcement Learning Suite 本次发布的数据集 Real-World Reinforcement Learning Suite, 该数据集是一套带有安全约束的连续控制任务,旨在评估强化学习算法的鲁棒性和安全性。这些任务包括Cartpole Swingup、Walker Walk、Walker Run、Quadruped Walk和Quadruped Run,每个任务的时间跨度为1000步,并设有特定的安全预算限制。该数据集涵盖了3个领域内的5个受约束任务,其目标是研究在连续控制任务上的安全强化学习。
查看Real-World Reinforcement Learning Suite
README 内容:
关于 Real-World Reinforcement Learning Suite , -
关于 arXiv , arXiv 是一个免费分发服务和开放获取的学术文章档案库,涵盖了物理学、数学、计算机科学、定量生物学、定量金融、统计学、电气工程和系统科学以及经济学等领域。该网站上的材料并未经过 arXiv 的同行评审。





_1769672084863.jpg)