Generated for the study 本次发布的数据集 Synthetic Workflow Dataset, 该数据集是为了模拟现实世界的工作流程,以评估Performant Agentic框架(PAF)在对话式人工智能应用中的有效性而生成的。每个数据集条目包含系统提示、对话历史和黄金响应。这些响应通过LLM-As-a-Judge以及人工评估进行验证。该数据集规模为模拟的100个对话,其任务是评估对话式人工智能中的图形遍历与节点选择方法。
关于 arXiv , arXiv 是一个免费分发服务和开放获取的学术文章档案库,涵盖了物理学、数学、计算机科学、定量生物学、定量金融、统计学、电气工程和系统科学以及经济学等领域。该网站上的材料并未经过 arXiv 的同行评审。





_1769672084863.jpg)