首页 / 开源数据市场 / 正文

Skywork 发布 Skywork-Reward-Preference-80K-v0.1 数据集, 应用在模型训练、偏好数据领域

五号数据雷达开源数据市场2024-12-12 19:1515

Skywork-Reward-Preference-80K-v0.1 是 Skywork 发布的数据集,于 2024-09-05 首发在 HuggingFace 应用于模型训练、偏好数据领域

Skywork 本次发布的数据集 Skywork-Reward-Preference-80K-v0.1, Skywork Reward Preference 80K是一个包含80K偏好对的数据子集，来源于公开数据。该数据集用于训练Skywork-Reward-Gemma-2-27B和Skywork-Reward-Llama-3.1-8B模型。数据集经过精心筛选，包含高质量的偏好对，并针对特定的能力和知识领域。数据集由多个公开数据源的子样本组成，包括HelpSteer2、OffsetBias、WildGuard和Magpie DPO系列。在数据集的筛选过程中，采用了多种策略以提高性能并平衡各领域，同时不损害整体性能。

查看Skywork-Reward-Preference-80K-v0.1

Dataset card 内容：

Files and versions 内容：

关于 Skywork , Skywork是一家专注于为航空航天、国防和安全市场提供先进无人机技术和解决方案的公司，致力于开发和生产高性能、可靠的无人机系统以满足客户需求。

关于 HuggingFace , Hugging Face是一个机器学习社区协作平台，专注于模型、数据集和应用程序的创建、发现和协作。该平台支持多种数据类型，包括文本、图像、视频、音频和3D数据，并提供开源工具和付费计算及企业解决方案。

社区讨论

近期热门

Skywork 发布 Skywork-Reward-Preference-80K-v0.1 数据集, 应用在 模型训练、偏好数据 领域

Dataset card 内容：

Files and versions 内容：

社区讨论

Skywork 发布 Skywork-Reward-Preference-80K-v0.1 数据集, 应用在模型训练、偏好数据领域