本次发布的数据集 gardian-cigi-ai-documents, 这是一个针对农业咨询AI应用的综合研究语料库,包含43,770篇来自CGIAR的农业研究出版物,经过专门处理和结构化,以桥接先进农业研究与田间咨询需求之间的差距。每个文档都使用GROBID工具系统化处理,以提取结构化内容并保持关键的科学背景和专业知识。数据集采用分块方法,以保持文档间的上下文连续性,适用于需要跨多个块传播上下文的任务,如问答或摘要。该语料库涵盖了多种农业主题,特别关注低收入和中等收入国家的小规模生产商。
Dataset card 内容:
Files and versions 内容:
关于 , 国庆学校是一所位于中国的教育机构,专注于提供基础教育服务。学校致力于培养学生的综合素质,注重学术与品德的全面发展。
关于 HuggingFace , Hugging Face是一个机器学习社区协作平台,专注于模型、数据集和应用程序的创建、发现和协作。该平台支持多种数据类型,包括文本、图像、视频、音频和3D数据,并提供开源工具和付费计算及企业解决方案。





_1769672084863.jpg)