five
五号数据雷达
产品上架
产权登记
知识产权
公共数据
首页 / 数据知识产权登记 / 正文

矿山大模型预训练语料数据集已成功在贵州省数据知识产权登记平台进行登记,应用在矿山数据、自然语言处理领域

五号数据雷达数据知识产权登记2025-11-29 17:4617
2025-11-28 , 四川省自然资源数字科技有限责任公司 旗下 矿山大模型预训练语料数据集 数据知识产权在 贵州省数据知识产权登记平台 完成登记 , 应用于 矿山数据、自然语言处理 领域

四川省自然资源数字科技有限责任公司 本次登记的数据知识产权 矿山大模型预训练语料数据集, 本规则严格遵循《信息安全技术 个人信息安全规范》(GB/T 35273-2020)及自然资源领域相关数据标准,旨在规范“矿山可信数据空间”内的所有数据处理活动。数据处理采用“统一汇聚、智能治理、分级应用”的技术路线。在加工工具层面,依托矿山可信数据空间作为核心底座,利用其内置的智能语义提取引擎与多模态大模型对地质报告、图件等非结构化数据进行自动化解析与知识抽取。对于数值型地物化遥数据,则通过数据转换-坐标重建-图层校正的处理管道进行时空对齐与标准化。 在涉及个人信息时,处理过程遵循 “数据分类-敏感识别-动态脱敏” 的全流程机制。我们采用基于知识图谱的实体识别算法自动定位姓名、单位等敏感信息,并应用 k-匿名与差分隐私 等模型进行严格的去标识化与匿名化处理,确保数据在“可用不可见”的前提下服务于大模型的训练与微调,最终形成覆盖十六种关键矿种、高质量、合规可用的探矿数据集。

查看矿山大模型预训练语料数据集

关于 四川省自然资源数字科技有限责任公司 , 四川省自然资源数字科技有限责任公司是一家专注于自然资源数字化解决方案的高科技企业,提供地理信息系统、大数据分析等服务,助力自然资源管理和生态文明建设。

关于 贵州省数据知识产权登记平台 , 贵州省数据知识产权登记平台是一个专门用于登记和公示数据知识产权的官方平台。该平台允许企业和个人提交其数据知识产权申请,并进行公示,以便公众查看和提出异议。平台还提供相关服务机构的信息,支持数据知识产权的保护和利用。

数据合作广告位

社区讨论

近期热门
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

二维码
关注我们