ICT2214-Team_7 本次发布的数据集 GPT_Generated_Dataset_Fold3_2000, 该数据集包含四个主要特征:id、tokens、pos_tags和chunk_tags。id是字符串类型的唯一标识符,tokens是字符串序列,表示文本中的词汇。pos_tags是词性标签的序列,包含47种不同的词性标签。chunk_tags是短语结构标签的序列,包含25种不同的短语结构标签。数据集分为训练集、验证集和测试集,分别包含1280、320和400个样本。
查看GPT_Generated_Dataset_Fold3_2000
Dataset card 内容:
Files and versions 内容:
关于 ICT2214-Team_7 , ICT2214-Team_7是一个专注于信息技术领域研究与实践的团队,致力于通过技术创新和应用开发,推动信息与通信技术的发展。
关于 HuggingFace , Hugging Face是一个机器学习社区协作平台,专注于模型、数据集和应用程序的创建、发现和协作。该平台支持多种数据类型,包括文本、图像、视频、音频和3D数据,并提供开源工具和付费计算及企业解决方案。





_1769672084863.jpg)