five
五号数据雷达
产品上架
产权登记
知识产权
公共数据
首页 / 数据知识产权登记 / 正文

贵州工匠行2500万条人资与法律问答语料数据集完成省级知识产权登记 赋能垂直大模型训练

五号数据雷达数据知识产权登记2026-04-30 00:368
2026年4月29日,贵州工匠行科技有限公司旗下规模达2500万条的人资与法律问答模型语料数据集,正式在贵州省数据知识产权登记平台完成知识产权登记,该合规专业语料可广泛应用于人力资源智能问答、法律服务智能咨询等领域,为垂直场景大模型训练、行业知识库搭建提供核心支撑。

当前,国内生成式AI产业进入垂直落地的关键周期,人资、法律等专业领域的高质量合规语料,已成为制约垂直大模型落地效果与合规性的核心稀缺资源。作为全国大数据产业发展先行区与数据要素市场化配置改革试点省份,贵州省搭建的数据知识产权登记平台,承担着为省内市场主体提供数据资产确权、合规校验、流通备案的公共服务职能,是贵州数据要素市场规范化运行的核心基础设施。

本次完成登记的贵州工匠行2500万人资和法律问答模型语料数据集,严格依托人资、法律领域的国家规范、行业标准制定采集与整理规则,首先通过文本爬虫、内容去重、敏感内容过滤算法完成原始数据清洗,从源头剔除违规、低质内容;再采用语义聚类、内容分类、句式归一化处理规则,统一问答句式与表述口径,规范数据集字段结构,降低后续训练与调用的适配成本;最终结合专业人工审核、合规校验、交叉校对三重机制筛选优质语料,全方位保障问答内容的严谨性、准确性与合规性,可直接适配垂直领域大模型训练、行业知识库构建、智能问答算法迭代等多元使用需求。

查看贵州工匠行2500万人资和法律问答模型语料数据集

作为经过官方知识产权确权的专业领域语料资产,该数据集的应用空间覆盖多个民生与企业服务场景:在人力资源领域,可支撑企业HR智能问答系统、用工风险智能预警工具、公共就业政策智能咨询服务的开发,覆盖劳动合同订立、薪酬社保核算、用工管理规范、劳动争议处理等高频需求,帮助企业降低人资管理的专业门槛,提升公共就业服务的响应效率;在法律服务领域,可赋能基层公共法律服务智能终端、中小企业合规智能咨询工具、全民法律科普智能服务的搭建,为普通民众、小微企业提供7*24小时的低成本基础法律问答服务,填补普惠法律服务的供给缺口。

本次登记不仅明确了该语料数据集的知识产权归属,为其后续的合规流转、商业化应用扫清了权属障碍,也为国内垂直领域专业语料的合规化生产、登记、流通提供了可复制的实践样本,对推动贵州大模型产业供给侧能力升级、加快全省数据要素价值释放具有积极意义。

登记内容:

登记内容公示图

数据合作广告位

社区讨论

近期热门
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

二维码
关注我们