five

五号数据雷达

资产融资
资源入表
产品交易
知识产权
首页 / 开源数据市场 / 正文
复旦大学 发布 World Preference Modeling (WorldPM) 数据集, 应用在 自然语言处理、用户偏好分析 领域
五号数据雷达开源数据市场2025-05-17 07:1837
World Preference Modeling (WorldPM) 是 复旦大学 发布的数据集,于 2025-05-16 首发在 arXiv 应用于 自然语言处理、用户偏好分析 领域

复旦大学 本次发布的数据集 World Preference Modeling (WorldPM), World Preference Modeling (WorldPM) 是一个从公共论坛收集偏好数据的规模化的偏好模型,旨在通过扩展定律来建立一个统一的偏好表示。数据集从StackExchange、Reddit和Quora等多个公共论坛收集了15M个训练样本,用于训练参数从1.5B到72B的语言模型。该数据集通过多种基准测试进行了评估,显示出在对抗性指标和客观指标上的显著提升,而在主观指标上没有明显的扩展趋势。WorldPM 作为偏好微调的基础模型,在多个基准测试中显著提高了泛化性能,并在内部和公开评估集上实现了显著的改进。

查看World Preference Modeling (WorldPM)

关于 复旦大学 , 复旦大学是中国著名的高等学府,位于上海,拥有多个学科领域的研究实力,是中国一流大学之一。

关于 arXiv , arXiv 是一个免费分发服务和开放获取的学术文章档案库,涵盖了物理学、数学、计算机科学、定量生物学、定量金融、统计学、电气工程和系统科学以及经济学等领域。该网站上的材料并未经过 arXiv 的同行评审。

近期热门
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

二维码
关注我们