five
五号数据雷达
产品上架
产权登记
知识产权
公共数据
首页 / 数据知识产权登记 / 正文

浙江完成养宠消费兴趣关键词数据集知识产权登记 可赋能宠物产业全链路决策

五号数据雷达数据知识产权登记2026-05-15 09:559
2026年5月14日,杭州探奥科技有限公司自研的基于记账内容的养宠用户兴趣关键词挖掘数据,正式在浙江省数据知识产权登记平台完成确权登记,该数据集既可支撑企业自身精细化用户运营,也可为宠物品牌、服务商提供消费趋势洞察,为垂直消费领域数据要素合规流通提供实践参考。

当前我国数据要素市场化配置改革进入落地攻坚阶段,数据知识产权登记作为明确数据权益归属、规范数据流通交易、激活数据资产价值的核心前置环节,已成为各垂直领域数字化发展的重要基础设施。作为全国首批数据知识产权制度改革试点省份,浙江省数据知识产权登记平台的登记结果具备确权公示效力,可为后续数据资产作价入股、质押融资、合规流通提供核心权益凭证。2026年5月14日,杭州探奥科技有限公司旗下基于记账内容的养宠用户兴趣关键词挖掘数据正式在该平台完成登记,成为宠物消费领域少数完成合规确权的垂直类数据集,为消费场景数据的资产化探索提供了新的实践样本。

据了解,本次登记的数据集核心来源于探奥科技自研宠物社区平台“宠one小程序”的用户授权记账数据,所有原始数据均由用户主动上传并明确授权使用,采集字段覆盖用户ID、记账类型、记账内容、金额、记账时间五大类。原始数据首先经过多轮预处理:剔除金额≤0的异常记录,清洗内容字段中的特殊字符与停用词,保证基础数据的真实性与有效性。在数据加工环节,研发团队采用“特征工程+大模型微调”的技术路径保障数据输出准确率:首先对清洗后的“内容”字段应用TF-IDF算法提取文本特征,与“金额”“记账类型”字段共同组合为多维特征向量作为模型输入;随后采用BERT-base-Chinese预训练模型进行微调,在模型最终输出层接入对应四大兴趣类别(饮食营养/健康医疗/行为训练与托管/居住与日常护理)的Softmax分类层,构建端到端分类模型。模型训练过程中,数据集按8:1:1划分为训练集、验证集与测试集,设置批次大小为32、学习率为3e-5、共训练10个轮次,实现对全量模型参数的优化。完成训练的模型可通过Softmax层输出每条记账记录对应四大类别的概率分布,将概率最高的类别判定为主兴趣类别;同时依托BERT模型自带的注意力机制,提取分类决策过程中关注度最高的词语作为核心兴趣关键词,最终实现每条记账记录对应输出主兴趣类别与核心兴趣关键词的结构化数据成果,全程无需引入外部工具,数据加工链路可溯源、标准可复现。

本次完成确权的数据集具备多重应用价值:对内可支撑企业实现精细化用户运营,基于算法生成的用户兴趣画像,运营团队可精准把握养宠用户的需求动向,动态优化内容推荐与服务策略,有效提升用户活跃度与留存;对外可向合作伙伴输出脱敏后的宠物消费兴趣趋势洞察,不含用户隐私信息的兴趣类别与关键词,可帮助宠物品牌、服务商精准把握市场需求的结构性变化,辅助其优化产品规划与营销资源分配,实现更高效的商业协同。此外,该数据集产出的带标注兴趣画像数据,还可作为推荐系统、消费预测模型的高质量训练与验证样本,作为模型反馈信号支撑算法迭代,形成“数据生成-模型优化-业务落地-数据反哺”的正向增强闭环。从行业应用场景来看,该数据集可广泛覆盖宠物产业各环节的决策需求:宠物食品品牌可通过饮食营养类关键词的周期变化,预判新兴食材、功能型粮品的消费趋势,提前调整SKU布局与产能规划;宠物医疗、服务机构可通过不同区域的健康医疗、托管训练类需求分布,优化线下门店选址与服务供给结构;宠物用品品牌也可依托居住与日常护理类关键词的变化,捕捉宠物智能设备、清洁用品等品类的消费新需求。

查看基于记账内容的养宠用户兴趣关键词挖掘数据

登记内容:

数据合作广告位

社区讨论

近期热门
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

二维码
关注我们