阿里巴巴集团本次发布的数据集MM-CondChain,MM-CondChain是由阿里巴巴Accio团队与浙江大学联合构建的多模态深度组合推理基准数据集,聚焦视觉 grounded 的多层条件链式推理任务。该数据集包含自然图像、数据图表和GUI轨迹三大视觉领域,通过可验证程序化中间表示(VPIR)技术确保每层条件的机械可验证性,采用智能合成流水线自动生成包含4+逻辑运算符、4+属性键的复杂条件链。其核心价值在于解决现有基准在组合深度和硬负样本方面的不足,为评估MLLMs在细粒度视觉验证、多元素推理及路径分支控制等复杂能力提供标准化测试平台,实验显示当前最强模型仅达53.33 Path F1。
关于阿里巴巴集团,阿里巴巴集团是中国领先的互联网科技公司,业务涵盖电子商务、云计算、数字媒体和娱乐等多个领域。
关于arXiv,全球最大的预印本学术论文数据库,涵盖物理、数学、计算机科学等多个学科领域。





_1769672084863.jpg)