本次发布的数据集ndl-core-structured-data,NDL Core – Structured Data是一个经过整理的英国公共部门结构化数据集集合,已转换为Apache Parquet格式以提高分析和机器学习工作流的效率。该数据集是更广泛的NDL Core Corpus的一部分,专注于表格/结构化数据,来源于英国政府及公共部门的权威平台,包括data.gov.uk、英国国家统计局(ONS)和英国环境、食品和农村事务部(Defra)。数据集旨在为研究、政策分析、数据科学和下游AI应用提供干净、分析就绪的基础。预期用途包括政策分析和评估、社会经济和环境研究、公共部门分析、机器学习模型的特征工程以及检索增强生成(RAG)流程。需要注意的是,数据集仅包含结构化数据,相关文本数据集在NDL Core Corpus中单独托管。数据集存在一些局限性,如数据反映的是爬取时的状态,某些数据集可能不完整、已过时或被上游替代,且不同来源的模式一致性不一,不保证实时更新。
Dataset card内容:
Files and versions内容:
关于,国庆学校是一所位于中国的教育机构,专注于提供基础教育服务。学校致力于培养学生的综合素质,注重学术与品德的全面发展。
关于HuggingFace,Hugging Face是一个机器学习社区协作平台,专注于模型、数据集和应用程序的创建、发现和协作。该平台支持多种数据类型,包括文本、图像、视频、音频和3D数据,并提供开源工具和付费计算及企业解决方案。





_1769672084863.jpg)