five
五号数据雷达
产品上架
产权登记
知识产权
公共数据
首页 / 数据知识产权登记 / 正文

浙江完成养宠用户兴趣关键词挖掘数据知识产权登记 覆盖宠物内容运营等多场景应用

五号数据雷达数据知识产权登记2026-05-15 09:4112
2026年5月14日,杭州探奥科技有限公司旗下基于自研宠one小程序养宠动态生成的用户兴趣关键词挖掘数据,在浙江省数据知识产权登记平台完成知识产权登记,将为宠物行业用户运营、品牌决策、算法迭代提供合规数据支撑,探索垂直消费领域数据要素合规流通路径。

近年来,国内宠物经济持续扩容,养宠人群的需求日益细分,宠物社区、品牌、线下服务商等市场主体对精准用户需求洞察的需求持续提升;与此同时,全国数据要素市场化建设加速推进,数据知识产权登记作为确认数据权属、保障数据合规流通的核心基础环节,已成为各行业挖掘数据价值的前提。作为国内率先落地的省级数据知识产权登记基础设施,浙江省数据知识产权登记平台承担着数据合规核验、权属公示、流通备案等核心职能,为各类市场主体的数据资产化提供官方公信力支撑。

2026年5月14日,杭州探奥科技有限公司旗下基于养宠动态发布内容的用户兴趣关键词挖掘数据,正式在该平台完成数据知识产权登记,成为宠物垂直领域少见的完成合规权属确认的用户行为衍生数据集。

据介绍,本次登记的数据集合法基础清晰,原始数据全部来自探奥科技自研的“宠one小程序”用户明确授权上传的养宠日常记录,采集字段包括用户id、动态内容、类目id和创建时间,完全符合个人信息保护相关法律法规要求。原始数据经过多轮标准化预处理:过滤动态内容为空或少于5字符的记录,清洗特殊字符与广告内容,标准化时间格式,剔除数据异常记录,从源头保障了数据集的质量可靠性。

本次数据集的加工规则自主可控、可追溯:首先采用RoBERTa-wwm-ext预训练语言模型作为基础,在其输出层增加四分类Softmax层,对应饮食营养、健康医疗、行为训练与托管、居住与日常护理四大养宠核心兴趣类别;随后将清洗后的动态内容文本结合所属类目ID共同输入模型训练,数据集按8:1:1比例划分为训练集、验证集与测试集,设置批次大小为32,学习率为5e-5,共训练8个轮次,同步优化模型全部参数以提升分类准确性;预处理后的数据输入微调完成的模型后,由Softmax层输出四大兴趣类别的概率分布,取概率最高者作为该动态记录的主兴趣类别,同时利用微调后模型内部的注意力机制,提取分类决策过程中权重最高的词语作为核心兴趣关键词,无需额外工具或后处理,最终输出每条养宠动态对应的主兴趣类别与核心兴趣关键词。

从应用价值来看,该数据集可覆盖三大核心场景:一是对内支撑宠物社区精细化运营,基于通过BERT模型微调生成的用户兴趣画像,运营团队能够精准把握养宠用户的需求动向,比如为新晋养宠人群推送宠物疫苗、驱虫相关科普内容,为有托管需求的用户匹配周边合规机构,动态优化内容推荐与服务策略,有效提升用户活跃度与留存;二是对外可为合作伙伴提供脱敏后的兴趣趋势洞察,经去标识化处理的用户主兴趣类别与关键词,能够帮助宠物食品、用品品牌及线下服务商把握市场需求的结构性变化,比如捕捉“老年宠粮”“行为矫正”等细分需求的上涨趋势,辅助其优化产品规划与营销资源分配,实现更精准的商业协同;三是为算法模型提供持续迭代的高质量训练与验证样本,该数据产出过程本身即依赖于模型微调,其输出的带标注的兴趣画像数据,可直接作为推荐系统及预测模型的反馈信号,用于模型的再训练与优化,形成从数据到模型、再从业务反馈到数据的增强闭环。

本次登记也为垂直消费领域的数据要素合规化探索提供了参考样本,明确的权属证明为后续该数据集的合规流通、交易、价值变现提供了基础凭证,也为其他消费细分领域的用户行为衍生数据登记、价值挖掘提供了可借鉴的路径。

查看基于养宠动态发布内容的用户兴趣关键词挖掘数据

登记内容:

数据合作广告位

社区讨论

近期热门
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

二维码
关注我们