five
五号数据雷达
产品上架
产权登记
知识产权
公共数据
首页 / 开源数据市场 / 正文

Intel 发布 polite-guard 数据集, 应用在 文本分类、客户服务 领域

五号数据雷达开源数据市场2025-01-17 06:4583
polite-guard 是 Intel 发布的数据集,于 2025-01-16 首发在 HuggingFace 应用于 文本分类、客户服务 领域

Intel 本次发布的数据集 polite-guard, Polite Guard数据集是一个用于文本分类任务的合成和注释数据集,主要任务是将文本分类为礼貌、有些礼貌、中立和不礼貌四个类别。数据集由50,000个通过Few-Shot提示生成的样本、50,000个通过Chain-of-Thought提示生成的样本以及200个来自企业培训的注释样本组成。合成数据被分为训练集(80%)、验证集(10%)和测试集(10%),每个集合都根据标签进行了平衡。注释数据仅用于评估。每个样本包含文本输入、分类标签、生成文本的语言模型来源以及生成文本时的推理过程。数据集涵盖了多个行业的客户服务互动,包括金融、旅游、餐饮、零售、体育俱乐部、文化和教育以及专业发展。

查看polite-guard

Dataset card 内容: 

 

Files and versions 内容: 

 

关于 Intel , 英特尔公司是全球领先的半导体芯片制造商。

关于 HuggingFace , Hugging Face是一个机器学习社区协作平台,专注于模型、数据集和应用程序的创建、发现和协作。该平台支持多种数据类型,包括文本、图像、视频、音频和3D数据,并提供开源工具和付费计算及企业解决方案。

数据合作广告位

社区讨论

近期热门
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

二维码
关注我们