five
五号数据雷达
产品上架
产权登记
知识产权
公共数据
首页 / 开源数据市场 / 正文

发布ndl-core-structured-data数据集,应用在公共部门数据、结构化数据领域

五号数据雷达开源数据市场2026-01-13 19:1923
ndl-core-structured-data是发布的数据集,于2026-01-12首发在HuggingFace应用于公共部门数据、结构化数据领域

本次发布的数据集ndl-core-structured-data,NDL Core – Structured Data是一个经过整理的英国公共部门结构化数据集集合,已转换为Apache Parquet格式以提高分析和机器学习工作流的效率。该数据集是更广泛的NDL Core Corpus的一部分,专注于表格/结构化数据,来源于英国政府及公共部门的权威平台,包括data.gov.uk、英国国家统计局(ONS)和英国环境、食品和农村事务部(Defra)。数据集旨在为研究、政策分析、数据科学和下游AI应用提供干净、分析就绪的基础。预期用途包括政策分析和评估、社会经济和环境研究、公共部门分析、机器学习模型的特征工程以及检索增强生成(RAG)流程。需要注意的是,数据集仅包含结构化数据,相关文本数据集在NDL Core Corpus中单独托管。数据集存在一些局限性,如数据反映的是爬取时的状态,某些数据集可能不完整、已过时或被上游替代,且不同来源的模式一致性不一,不保证实时更新。

查看ndl-core-structured-data

Dataset card内容:

 

Files and versions内容:

 

关于,国庆学校是一所位于中国的教育机构,专注于提供基础教育服务。学校致力于培养学生的综合素质,注重学术与品德的全面发展。

关于HuggingFace,Hugging Face是一个机器学习社区协作平台,专注于模型、数据集和应用程序的创建、发现和协作。该平台支持多种数据类型,包括文本、图像、视频、音频和3D数据,并提供开源工具和付费计算及企业解决方案。

数据合作广告位

社区讨论

近期热门
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

二维码
关注我们