Skywork 本次发布的数据集 Skywork-Reward-Preference-80K-v0.1, Skywork Reward Preference 80K是一个包含80K偏好对的数据子集,来源于公开数据。该数据集用于训练Skywork-Reward-Gemma-2-27B和Skywork-Reward-Llama-3.1-8B模型。数据集经过精心筛选,包含高质量的偏好对,并针对特定的能力和知识领域。数据集由多个公开数据源的子样本组成,包括HelpSteer2、OffsetBias、WildGuard和Magpie DPO系列。在数据集的筛选过程中,采用了多种策略以提高性能并平衡各领域,同时不损害整体性能。
查看Skywork-Reward-Preference-80K-v0.1
Dataset card 内容:
Files and versions 内容:
关于 Skywork , Skywork是一家专注于为航空航天、国防和安全市场提供先进无人机技术和解决方案的公司,致力于开发和生产高性能、可靠的无人机系统以满足客户需求。
关于 HuggingFace , Hugging Face是一个机器学习社区协作平台,专注于模型、数据集和应用程序的创建、发现和协作。该平台支持多种数据类型,包括文本、图像、视频、音频和3D数据,并提供开源工具和付费计算及企业解决方案。





_1769672084863.jpg)