five
五号数据雷达
产品上架
产权登记
知识产权
公共数据
首页 / 开源数据市场 / 正文

PKU-Alignment 发布 Align-Anything-Instruction-100K-zh 数据集, 应用在 自然语言处理、中文数据集 领域

五号数据雷达开源数据市场2024-12-13 05:0123
Align-Anything-Instruction-100K-zh 是 PKU-Alignment 发布的数据集,于 2024-07-21 首发在 HuggingFace 应用于 自然语言处理、中文数据集 领域

PKU-Alignment 本次发布的数据集 Align-Anything-Instruction-100K-zh, Align-Anything-Instruction-100K-zh是一个高质量的中文指令遵循数据集,包含100K问题-答案对。这些条目涵盖了总结、创作、提取、分类、角色扮演、知识问答、开放问答、推理、头脑风暴等多个类别。数据集中的50.7%来自公共数据集如Firefly和COIG,而49.3%的指令由我们精心构建并由GPT-4在专家指导下标注。每个QA对都根据特定指南由GPT-4进行后期处理,确保了数据集的高质量。

查看Align-Anything-Instruction-100K-zh

Dataset card 内容: 

 

Files and versions 内容: 

 

关于 PKU-Alignment , PKU-Alignment是北京大学的研究小组,专注于强化学习、大型语言模型和价值对齐研究。

关于 HuggingFace , Hugging Face是一个机器学习社区协作平台,专注于模型、数据集和应用程序的创建、发现和协作。该平台支持多种数据类型,包括文本、图像、视频、音频和3D数据,并提供开源工具和付费计算及企业解决方案。

数据合作广告位

社区讨论

近期热门
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

二维码
关注我们