随着多模态大模型技术向生活服务、智能家居等垂直场景渗透,AI烹饪指导、智能厨电交互等应用的商业化进程不断加快,但长期以来,该领域的训练数据集多聚焦于标准化正确操作流程的标注,缺少对用户操作错误、反事实调整方案的结构化标注数据,成为制约烹饪场景AI能力落地的核心瓶颈之一。作为全球领先的移动智能技术与AI解决方案提供商,高通长期面向AI研发领域开放各类垂直场景训练数据集,此次发布的烹饪场景数据集是其在生活服务AI赛道的最新布局。
2026年5月1日,高通正式在Hugging Face平台上线发布qualcomm-interactive-cooking-dataset-counterfactual-mistakes(高通交互式烹饪反事实错误数据集),定向填补了这一垂直场景数据缺口。据官方披露,本次发布的数据集为合成类训练数据集,核心价值是为交互式烹饪指导场景的错误干预模型训练提供标注素材,所有记录均对应带指令/反馈文本对及时间戳的视频片段,采用视频+文本的多模态结构,总记录规模达25087条,源自1110个独立烹饪视频,数据字段覆盖数据集来源、视频ID、片段起止时间、错误类型、文本内容、文本时间戳、文本类型七大维度,可直接适配多模态文本生成类模型的微调需求。
为保障标注内容的专业性与丰富度,该数据集的标注内容由Qwen3-VL-32B-Instruct与Gemini-2.5-Pro两大前沿多模态大模型协同生成,目前仅面向研究场景开放使用,商用及二次分发需严格遵守高通官方公布的交互式烹饪数据集许可条款。
从落地价值来看,该数据集可覆盖多类烹饪相关AI场景的训练需求:在面向C端的交互式烹饪指导应用中,基于该数据集训练的AI模型可实时识别用户烹饪操作中的错误动作(如食材投放顺序错误、火候控制不当、调味剂量偏差等),并同步给出针对性调整建议,甚至可推导操作错误后的反事实补救方案;在智能家居领域,该数据集可支撑智能炒菜机、嵌入式蒸烤箱等智慧厨电的交互能力升级,实现用户操作与设备运行的联动纠错;此外,该数据集还可应用于家政服务人员技能培训系统、视障群体烹饪辅助工具等公益类场景的AI能力研发。
查看qualcomm-interactive-cooking-dataset-counterfactual-mistakes





_1769672084863.jpg)