当前我国数据要素市场化建设已进入权属确认、合规流通的深化阶段,科研数据作为支撑创新决策、学术合作的核心要素,其知识产权规范化管理是释放数据价值的重要前提。作为国内率先落地的省级数据知识产权登记服务载体,上海市数据产品知识产权管理平台承担着数据产品权属存证、合规校验、流通溯源等核心职能,为各类数据产品的市场化流通提供制度性基础支撑。2026年5月6日,贺致远旗下基于DFG-GEPRIS权威数据开发的德英双语德国科学基金会(DFG)资助项目数据集,正式在该平台完成数据知识产权登记,成为国内首个获得官方合规存证的DFG全量项目知识图谱类数据产品。
据了解,德国科学基金会(DFG)是德国乃至欧洲最具影响力的公共科研资助机构,其官方公开的GEPRIS数据库覆盖了数十年间全量资助项目的核心信息,是研究德国科研布局、开展国际学术合作的重要参考数据源。本次完成登记的数据集基于原始公开数据做了结构化重构,采用SQLite/Excel存储,将非结构化的DFG公开数据梳理为“节点表+边表”构成的关系型知识图谱,具体数据组织与字段规范如下:
- 项目表 (Projects):主键为Project_ID,存有项目标题、德英双语摘要、起止年份、资助类型、所属学科、项目介绍及是否为中国相关项目(Is_China_Related)等核心属性;
- 人员表 (Persons):主键为Person_ID,包含项目参与人员姓名、所属地址及原始数据溯源URL;
- 机构表 (Institutions):主键为Institution_ID,包含承担项目的机构名称、地址及原始数据溯源URL;
- 成果表 (Publications):记录项目产出的论文标题、发表年份等关联成果信息;
- 边表 (Edges):包含“项目-人员”“项目-机构”两类关联表,通过主外键关联项目ID与人员/机构ID,明确定义不同主体在项目中的角色关系。
在技术实现层面,该数据集采用异步高并发引擎完成原始数据抓取,通过SQLite WAL模式确保数据写入的原子性,避免数据采集过程中的内容丢失与错漏;同时通过正则表达式及降维算法将非结构化的公开信息扁平化为二阶关系表,原生支持社会网络分析(SNA)与面板数据运算,可直接适配各类量化研究工具的调用需求。
从应用价值来看,本次完成登记的数据集可覆盖多类科研相关场景:在科研管理领域,主管部门可通过该数据集对比中德两国在不同学科的资助强度、资助周期、布局方向差异,优化国内科研资助的资源配置方案;在国际合作领域,高校、科研院所可通过数据中的关联关系,挖掘德国前沿领域的核心研究团队、优势机构,结合“中国相关项目”标签梳理现有合作基础,精准拓展交叉学科合作空间;在学术研究领域,研究者可基于项目资助与成果产出的关联数据,开展科研投入产出效率、学术合作网络演化等方向的量化研究;在产学研对接领域,科技企业可检索对应技术赛道的资助项目,提前对接德国科研端的前沿创新成果,布局跨境技术合作。
本次数据集完成知识产权登记,一方面意味着该产品的权属归属、采集加工合规性得到官方存证,后续面向各类主体提供数据服务时,可有效降低流通环节的权属纠纷风险;另一方面也为涉外公共数据的加工、登记、流通提供了可参考的实践样本,对完善我国科研数据要素流通体系、支撑跨境学术合作的数字化治理具有积极的探索意义。
查看基于DFG-GEPRIS权威数据的德英双语德国科学基金会资助项目数据集





_1769672084863.jpg)