当前我国餐饮外卖行业已步入存量竞争周期,餐饮品牌与平台普遍面临客群定位模糊、营销投放效率低、用户留存难等核心痛点,合规可用的用户消费行为数据成为制约餐饮行业AI应用落地的关键瓶颈。作为全国较早搭建省级数据知识产权登记体系的省份,浙江省数据知识产权登记平台承担着数据资源确权登记、权益保障、流通支撑的核心职能,是国内数据要素市场化配置的重要基础设施。
2026年5月22日,临海数云创想信息技术有限公司旗下「AI数字人模拟餐饮与外卖消费偏好训练数据」正式在该平台完成知识产权登记,成为餐饮消费领域合规可流通训练数据的典型代表。不同于传统采集的真实用户行为数据,该训练数据基于AI数字人技术生成,通过构建虚拟海量人群模拟餐饮外卖点餐与消费行为并完成聚类分群,既规避了个人信息采集的合规风险,又能高度贴合真实市场的消费特征,可精准解决餐饮品牌与外卖平台在客群识别、运营决策、营销投放、供应链管理、服务智能化等场景中的核心痛点。
为保障数据的准确性与可用性,该数据集采用了四层核心算法体系:一是采用DBSCAN 聚类算法,以性别、收入水平、口味偏好、点餐时段、配送距离为核心维度,对虚拟消费人群聚类分群,精准识别高价值餐饮外卖客群;二是采用Transformer 时序预测模型,基于用户点餐频次、时段分布、复购行为开展时序建模,预测点餐周期、下单概率及门店复购率,为精细化运营提供依据;三是采用特征加权融合算法,对口味、时段、套餐、距离、收入等特征权重拟合,生成贴合真实餐饮外卖市场分布的虚拟人群样本;四是采用规则引擎 + LightGBM 分类模型,构建点餐行为判定逻辑,精准预测口味偏好、点餐时段、套餐选择、外卖距离、门店复购等级五大指标,支撑智能推荐与运营决策。
从数据字段来看,该数据集覆盖三大类核心维度:第一类是餐饮外卖核心偏好字段,包含主口味偏好(辣味、咸鲜、酸甜、清淡、重麻、其他)、点餐时段(早餐、午餐、下午茶、晚餐、夜宵)、套餐类型偏好(单人简餐、单人套餐、双人餐、多人分享餐、无套餐)、可接受配送距离范围(1km以内、1-3km、3-5km、5km以上)、门店复购等级(高复购、中复购、低复购)、30天门店复购率(取值0.0–1.0),可支撑口味预测、菜品推荐、菜单优化、时段营销、人力排班、订单预测、配送规划、门店覆盖、运力调度等多元场景;第二类是用户基础画像字段,包含性别、收入水平,可用于客群细分与偏好分析、消费能力判断、定价与客群筛选;第三类是模型训练与性能指标字段,训练时长固定为8.5小时、底层模型算法为LightGBM,精度达0.89、召回率0.87、F1分数0.88、实时性能评估0.86,兼具可解释性、可确权性与落地可用性。
在技术实现逻辑上,该数据集基于餐饮、快餐、外卖真实订单与行为数据构建虚拟人群先验分布模型;通过AI 数字人多轮交互采集行为特征,迭代优化标签体系。采用权重归一化、区域消费分布校准、时段节律拟合技术,保障虚拟人群与真实市场高度一致;支持偏好动态更新,适配时段、季节、大促、新品、商圈差异等多场景需求,数据稳定、可复用、可确权。
从实际应用价值来看,该数据集可覆盖三大核心运营场景:一是精准锁定核心客群,通过口味偏好、点餐时段、套餐选择、外卖距离、门店复购五大维度数据规则处理,可快速识别高价值客群、高频点餐客群、高复购忠诚客群,解决传统运营中客群定位不清、目标用户不明确的问题,为餐饮品牌、外卖平台提供清晰的主力消费人群画像,支撑菜品定向推荐、时段精准营销、门店资源高效分配,显著提升订单转化效率与平台GMV,降低低效运营与盲目投放成本;二是精细化用户运营,基于处理后的标准化用户偏好数据,可针对不同客群制定差异化套餐推荐、个性化配送策略、分层会员触达、精准优惠券发放方案,解决客群运营粗放、用户粘性不足、复购率偏低的问题,实现千人千面的精细化运营管理,有效提升用户复购频率与门店品牌忠诚度;三是科学制定经营策略,依托口味偏好分布、点餐时段等数据,可解决菜品同质化、定价不合理、配送范围模糊等痛点,为新菜品研发、新店选址、供应链备货等决策提供数据支撑。除直接服务餐饮品牌与外卖平台外,该数据集还可应用于食材供应链企业需求预测、商圈业态规划、本地生活服务平台的算法训练等潜在场景。
登记内容:
本次数据知识产权登记的完成,既标志着AI生成类训练数据的合规性与知识产权价值得到了官方层面的认可,也为生活服务领域数据要素的合规流通、价值释放提供了可参考的实践样本,对于推动餐饮行业数字化转型、完善数据要素市场化配置体系均具有积极意义。





_1769672084863.jpg)