天津大学本次发布的数据集SAGE (Service Agent Graph-guided Evaluation),SAGE是由天津大学等机构联合开发的客服领域多智能体评估基准,旨在通过动态对话图模型验证逻辑合规性。该数据集通过对抗意图分类和模块化扩展机制,支持6大工业场景的自动化对话合成。其核心是将非结构化标准操作流程(SOPs)转化为有向图,结合规则引擎和评判智能体实现双轴评估,解决了传统静态评测在逻辑覆盖和对抗测试上的不足,为客服代理的流程推理和对话质量提供精准诊断。
查看SAGE (Service Agent Graph-guided Evaluation)
关于天津大学,天津大学是中国教育部直属的全国重点大学,始建于1895年,是中国第一所现代大学。学校以工科见长,形成了工科优势明显、理工结合、经管文法等多学科协调发展的综合性大学格局。
关于arXiv,全球最大的预印本学术论文数据库,涵盖物理、数学、计算机科学等多个学科领域。





_1769672084863.jpg)