斯坦福大学 本次发布的数据集 LitBench, LitBench 是一个针对创造性写作的评估基准和配套数据集,旨在评估由大型语言模型生成的创造性写作。该数据集包含来自 Reddit 的 2,480 个经过去偏处理、由人工标注的故事比较,以及一个包含 43,827 对人工偏好标签的训练语料库。LitBench 的设计旨在评估现有的零样本评估方法,并促进学习验证器的发展,使其更好地与人类偏好一致。
关于 斯坦福大学 , 斯坦福大学是一所位于美国加州的世界顶尖私立研究型大学,以其在科技、工程、商业和法律等领域的卓越教学和研究而闻名。
关于 arXiv , arXiv 是一个免费分发服务和开放获取的学术文章档案库,涵盖了物理学、数学、计算机科学、定量生物学、定量金融、统计学、电气工程和系统科学以及经济学等领域。该网站上的材料并未经过 arXiv 的同行评审。





_1769672084863.jpg)