FAIR at Meta 本次发布的数据集 reWordBench, reWordBench是一个用于评估奖励模型鲁棒性的基准数据集,基于原始的RewardBench数据集,通过应用多种意义保持或排名保持的转换来修改实例。数据集涵盖了控制性转换、自然转换和领域特定转换三种类型,旨在测试奖励模型在不同变换下的性能变化。该数据集可应用于自然语言处理领域,帮助研究者评估和改进奖励模型的鲁棒性。
关于 FAIR at Meta , FAIR at Meta,全称为Facebook AI Research at Meta,是Meta公司(原Facebook公司)旗下的人工智能研究部门,致力于推动人工智能科学的发展和应用。
关于 arXiv , arXiv 是一个免费分发服务和开放获取的学术文章档案库,涵盖了物理学、数学、计算机科学、定量生物学、定量金融、统计学、电气工程和系统科学以及经济学等领域。该网站上的材料并未经过 arXiv 的同行评审。





_1769672084863.jpg)