首页 / 开源数据市场 / 正文

Skywork 发布 Skywork-Reward-Preference-80K-v0.2 数据集, 应用在模型训练、偏好对领域

五号数据雷达开源数据市场2024-10-13 07:3571

Skywork-Reward-Preference-80K-v0.2 是 Skywork 发布的数据集,于 2024-10-12 首发在 HuggingFace 应用于模型训练、偏好对领域

Skywork 本次发布的数据集 Skywork-Reward-Preference-80K-v0.2, Skywork Reward Preference 80K数据集是一个包含80K偏好对子集，源自公开数据。该数据集用于训练Skywork-Reward-Gemma-2-27B和Skywork-Reward-Llama-3.1-8B模型。数据集经过精心策划，包含高质量的偏好对，并针对特定的能力和知识领域。数据集由多个公开数据源的子样本组成，包括HelpSteer2、OffsetBias、WildGuard（对抗性）和Magpie DPO系列。在数据集策划过程中，采用了多种技巧来提高性能并平衡各领域，同时不损害整体性能。

查看Skywork-Reward-Preference-80K-v0.2

Dataset card 内容：

Files and versions 内容：

关于 Skywork , Skywork是一家专注于为航空航天、国防和安全市场提供先进无人机技术和解决方案的公司，致力于开发和生产高性能、可靠的无人机系统以满足客户需求。

关于 HuggingFace , Hugging Face是一个机器学习社区协作平台，专注于模型、数据集和应用程序的创建、发现和协作。该平台支持多种数据类型，包括文本、图像、视频、音频和3D数据，并提供开源工具和付费计算及企业解决方案。

社区讨论

近期热门

Skywork 发布 Skywork-Reward-Preference-80K-v0.2 数据集, 应用在 模型训练、偏好对 领域

Dataset card 内容：

Files and versions 内容：

社区讨论

Skywork 发布 Skywork-Reward-Preference-80K-v0.2 数据集, 应用在模型训练、偏好对领域