本次发布的数据集 Synthetic Historical Dataset, 该数据集包含了第一年收集的日志数据,用于估算第二年目标时间点新政策的未来价值。数据集融合了季节性和非平稳特性,通过抽样时间戳和上下文向量,合成预期的奖励函数,并应用记录策略生成。此外,该数据集还包括季节性效应,旨在模拟非平稳性。数据规模根据样本数量而定(对于未来离策略评估(F-OPE)样本量为1000,对于未来离策略学习(F-OPL)样本量为8000)。该数据集的任务包括未来离策略评估(F-OPE)和未来离策略学习(F-OPL)。
查看Synthetic Historical Dataset
关于 arXiv , arXiv 是一个免费分发服务和开放获取的学术文章档案库,涵盖了物理学、数学、计算机科学、定量生物学、定量金融、统计学、电气工程和系统科学以及经济学等领域。该网站上的材料并未经过 arXiv 的同行评审。





_1769672084863.jpg)