当前我国数据要素市场化建设已进入“确权先行、合规流通”的深化阶段,数据知识产权登记作为明确数据权属、保障数据资产合法权益、支撑数据跨主体流通的核心前置环节,已成为各地推进数字经济创新的重点方向。作为全国首个国家级大数据综合试验区,贵州近年来在数据知识产权制度创新、特色产业数据价值化探索方面走在全国前列,而白酒作为贵州核心支柱产业,防伪溯源难、消费行为数据碎片化一直是产业数字化转型的核心痛点。2026年5月6日,贵州卓霖科技有限公司旗下“真品购原浆酒产品消费验证行为数据集”正式在贵州省数据知识产权登记平台完成登记,成为国内少有的面向白酒消费场景的合规确权行为类数据集。本次登记的数据集采用全链路规范化处理流程,具体技术规范如下:
一、数据提取算法
采用字段选择性抽取策略,依据业务目标保留关键信息,且所有用户标识均采用匿名化处理,严格符合数据安全合规要求:
身份标识:Id、微信OPENID(用于匿名化用户行为追踪,不涉及用户隐私信息)
产品凭证:产品ID、防伪编码(核心防伪依据,可关联产品全链路流通信息)
时空行为:查询时间、省份、城市、地区、经度、纬度(地理分布分析、消费热力构建的核心基础)
交互属性:业务类型(“密码锁”/“防伪标”)、是否第一次查询(真伪验证有效性判定核心指标)
结果反馈:查询回复信息(验证结果内容)、企业ID(数据权属主体明确标识)
二、数据清洗与标准化算法
为提升数据集的通用性与适配性,本次数据集通过三重标准化处理实现口径统一:
1.时间格式转换
将原始“月/日/年 时:分:秒 AM/PM”格式统一转换为 ISO 8601标准时间格式 YYYY-MM-DD HH:MM:SS,便于后续开展时间序列消费趋势分析和跨系统数据对接。
2.地理信息补全
对地区字段为空但省份、城市信息完整的记录,通过官方行政区划映射库进行智能补全;若无法补全,则标记为“缺失区县”,保留上层地理信息用于分析,最大化降低有效数据损耗。
3.文本内容规范化
替换查询回复信息中的占位符 [pname] 为实际产品名称“真品购原浆酒”;将空值或无反馈记录统一标注为“无效查询”,便于后续数据过滤与异常行为分析。
从应用价值来看,本次完成确权的数据集可覆盖多个产业端与监管端典型应用场景:其一在产品防伪验证领域,通过防伪编码的查询行为数据,可快速识别假冒产品的分布区域、出现频次,为白酒企业开展打假行动、市场监管部门治理酒类市场秩序提供数据支撑,同时也能为消费者提供更可靠的真伪验证服务,降低消费者购假风险;其二在消费者行为分析领域,结合时空数据、查询频次、交互属性标签,可实现不同区域的消费偏好分析、用户群体画像构建、产品投放效果评估,帮助白酒企业优化市场运营策略、调整产品供给结构,提升数字化运营效率。本次数据集的成功登记,是贵州白酒产业数据价值化的典型实践,既为白酒行业垂直场景的数据确权、合规流通提供了可复制的样本,也为贵州地方特色产业与数据要素融合发展探索了新路径,后续该数据集可通过合规方式进入数据交易场所流通,进一步释放数据价值,助力贵州数字经济与实体经济的深度融合。





_1769672084863.jpg)