Skywork 本次发布的数据集 Skywork-Reward-Preference-80K-v0.2, Skywork Reward Preference 80K数据集是一个包含80K偏好对子集,源自公开数据。该数据集用于训练Skywork-Reward-Gemma-2-27B和Skywork-Reward-Llama-3.1-8B模型。数据集经过精心策划,包含高质量的偏好对,并针对特定的能力和知识领域。数据集由多个公开数据源的子样本组成,包括HelpSteer2、OffsetBias、WildGuard(对抗性)和Magpie DPO系列。在数据集策划过程中,采用了多种技巧来提高性能并平衡各领域,同时不损害整体性能。
查看Skywork-Reward-Preference-80K-v0.2
Dataset card 内容:
Files and versions 内容:
关于 Skywork , Skywork是一家专注于为航空航天、国防和安全市场提供先进无人机技术和解决方案的公司,致力于开发和生产高性能、可靠的无人机系统以满足客户需求。
关于 HuggingFace , Hugging Face是一个机器学习社区协作平台,专注于模型、数据集和应用程序的创建、发现和协作。该平台支持多种数据类型,包括文本、图像、视频、音频和3D数据,并提供开源工具和付费计算及企业解决方案。





_1769672084863.jpg)