Intel 本次发布的数据集 polite-guard, Polite Guard数据集是一个用于文本分类任务的合成和注释数据集,主要任务是将文本分类为礼貌、有些礼貌、中立和不礼貌四个类别。数据集由50,000个通过Few-Shot提示生成的样本、50,000个通过Chain-of-Thought提示生成的样本以及200个来自企业培训的注释样本组成。合成数据被分为训练集(80%)、验证集(10%)和测试集(10%),每个集合都根据标签进行了平衡。注释数据仅用于评估。每个样本包含文本输入、分类标签、生成文本的语言模型来源以及生成文本时的推理过程。数据集涵盖了多个行业的客户服务互动,包括金融、旅游、餐饮、零售、体育俱乐部、文化和教育以及专业发展。
Dataset card 内容:
Files and versions 内容:
关于 Intel , 英特尔公司是全球领先的半导体芯片制造商。
关于 HuggingFace , Hugging Face是一个机器学习社区协作平台,专注于模型、数据集和应用程序的创建、发现和协作。该平台支持多种数据类型,包括文本、图像、视频、音频和3D数据,并提供开源工具和付费计算及企业解决方案。





_1769672084863.jpg)