当前我国数据要素市场建设已进入垂直消费领域落地的关键阶段,随着宠物经济成为年规模超万亿的消费新赛道,宠物消费行为数据的合规确权、流通应用成为产业数字化升级的核心痛点。作为全国率先上线的省级数据知识产权登记服务载体,浙江省数据知识产权登记平台承担着数据权属公示、合规存证、权益保护、流通支撑等核心职能,其出具的登记证明可作为数据资产市场化交易、质押融资、权益维权的法定依据。2026年5月14日,杭州探奥科技有限公司自研的「基于记账内容的养宠用户兴趣关键词挖掘数据」正式在该平台完成数据知识产权登记,成为国内宠物消费领域首批完成合规确权的用户行为类数据资产。
据了解,本次登记的数据资产基于探奥科技自研宠物社区平台「宠one小程序」的用户授权数据开发而来,其生产全流程均符合数据安全相关法规要求:
1. 数据来源与预处理:加工前的数据为平台用户自主上传的宠物消费记账数据,已获得用户明确授权,采集字段涵盖用户ID、记账类型、记账内容、金额、记账时间;预处理环节剔除金额≤0的异常记录,同时清洗内容字段中的特殊字符与停用词,保障基础数据质量。
2. 算法处理规则:首先对清洗后的“内容”字段应用TF-IDF算法提取文本特征,与“金额”“记账类型”字段共同组合为多维特征向量作为模型输入;随后采用BERT-base-Chinese预训练模型进行微调,在BERT模型最终输出层接入对应饮食营养、健康医疗、行为训练与托管、居住与日常护理四大兴趣类别的Softmax分类层,构建端到端分类模型;训练过程中将数据集按8:1:1划分为训练集、验证集与测试集,设置批次大小为32,学习率为3e-5,共训练10个轮次,同步优化BERT参数与Softmax层参数;最终通过模型输出的概率分布判定主兴趣类别,并借助BERT模型的注意力机制提取核心兴趣关键词,无需引入外部工具即可完成全流程处理。
3. 最终数据输出:每条记账记录经处理后,输出对应的主兴趣类别与核心兴趣关键词,全链路可追溯、可验证。
本次完成登记的数据资产具备多重应用价值:对内可支撑平台实现精细化用户运营,基于生成的用户兴趣画像,运营团队可精准把握养宠用户的需求动向,动态优化内容推荐与服务策略,有效提升用户活跃度与留存;对外可为宠物品牌及相关服务商提供脱敏后的消费兴趣趋势洞察,帮助市场主体把握宠物行业需求的结构性变化,辅助优化产品规划与营销资源分配,降低经营试错成本;此外,该数据产出的带标注兴趣画像数据,可直接作为推荐系统及消费预测模型的高质量训练样本,形成从数据到模型、再从业务反馈到数据的增强闭环,为大模型在宠物垂直领域的落地提供数据支撑。未来,该数据还可拓展应用于宠物食品新品研发需求预判、宠物服务精准触达、城市养宠公共服务优化等多个场景。 本次数据知识产权登记不仅是探奥科技推动自身数据资产化的重要落地成果,也为宠物消费垂直领域的数据合规流通、市场化应用提供了可复制的参考样本,对于探索消费类数据要素的价值释放路径、推动宠物产业数字化升级具有重要的行业示范意义。





_1769672084863.jpg)