华为加拿大研究院本次发布的数据集IndusReqFlow,IndusReqFlow是由华为加拿大研究院创建的专有工业流程图数据集,旨在为工业需求工程中的流程图转换研究提供真实世界的数据基准。该数据集包含52个从华为系统级需求文档中收集的流程图,平均每个图含有11.15个节点和11.73条边,数据来源于光网络、数据通信和电动汽车系统等多个工业领域。数据集的构建过程包括由测试工程师独立编写Mermaid代码,并通过对比渲染输出与原始图像进行一致性验证,对于存在分歧的案例通过讨论或专家咨询予以解决。该数据集主要应用于评估和提升基于视觉语言模型的流程图到Mermaid代码的转换性能,旨在解决工业需求文档中静态流程图无法被机器解析的视觉规范鸿沟问题,从而支持基于模型的测试生成和覆盖分析等下游自动化任务。





_1769672084863.jpg)