five
五号数据雷达
产品上架
产权登记
知识产权
公共数据
首页 / 开源数据市场 / 正文

苏黎世联邦理工学院发布ACTIVEULTRAFEEDBACK数据集,应用在大语言模型对齐、偏好学习领域

五号数据雷达开源数据市场2026-03-12 03:1949
ACTIVEULTRAFEEDBACK是苏黎世联邦理工学院发布的数据集,于2026-03-10首发在arXiv应用于大语言模型对齐、偏好学习领域

苏黎世联邦理工学院本次发布的数据集ACTIVEULTRAFEEDBACK,ACTIVEULTRAFEEDBACK是由苏黎世联邦理工学院团队开发的偏好数据集生成框架,旨在解决大语言模型对齐任务中标注成本高昂的问题。该数据集通过集成30个开源大模型生成多样化候选响应,采用基于不确定性的主动学习策略(如DRTS和DELTAUCB)动态筛选最具信息量的样本对,仅需传统方法1/6的标注量即可达到同等效果。数据生成过程包含响应生成、奖励预测、动态配对选择等模块化流程,特别适用于低资源领域和专家场景的模型微调与奖励建模,显著提升了DPO等优化算法的样本效率。

查看ACTIVEULTRAFEEDBACK

关于苏黎世联邦理工学院,苏黎世联邦理工学院(ETH Zurich)是瑞士两所联邦理工学院之一,位于德语区苏黎世,是世界顶尖的科学技术研究型大学,以工程技术、自然科学和建筑学等领域的卓越研究闻名。

数据合作广告位

社区讨论

近期热门
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

二维码
关注我们