当前,工具调用能力已经成为大模型落地复杂业务场景的核心刚需,监督微调(SFT)则是让大模型对齐人类需求、掌握特定场景能力的核心环节,但行业长期缺乏专门针对目标导向工具使用场景的结构化对话训练数据集,多数研发团队需自行标注数据,不仅成本高企,也存在标准不统一、效果难对齐等问题。近日,全球顶尖NLP研究机构俄亥俄州立大学NLP组正式发布QUEST-SFT-Data-Objective数据集,填补了这一领域的供给空白。该数据集是专门面向QUEST(工具使用助手格式)监督微调场景打造的训练数据集,聚焦目标风格的任务轨迹设计,目前仅开放训练集划分。数据以完整对话轨迹的形式组织,核心字段为名为messages的列表,列表内每个元素为包含role(角色)和content(内容)两个键的字典,1:1还原用户与助手围绕特定任务目标展开交互、调用工具完成需求的全流程序列,核心目标是帮助AI助手在训练或微调过程中,快速掌握目标导向的对话逻辑与工具调用格式,提升复杂任务的完成率。
该数据集可广泛应用于多个垂直领域的AI助手研发:在政务服务场景,可用于微调政务智能客服,使其掌握多轮引导用户提交材料、调用政务服务接口完成业务办理的能力;在企业办公场景,可用于训练智能办公助手,使其具备调度日程工具、文档工具、数据查询工具完成复杂办公任务的能力;在消费级智能助手场景,可优化多轮对话下的工具调用逻辑,提升设备控制、生活服务预约等场景的任务完成率;此外还可支撑多工具协同调度类大模型的微调训练,帮助大模型掌握复杂任务下的工具选择、参数传递、结果整合逻辑。本次发布的数据集采用Open Data Commons Attribution License (ODC-BY) v1.0许可证,使用者仅需标注来源即可进行二次开发、商用等操作,大幅降低了各类研发团队的使用门槛。作为AI训练数据要素市场的重要补充,该数据集的发布有助于统一工具类AI助手的训练数据标准,降低中小研发团队的标注成本,推动大模型工具调用能力的普惠化落地,进一步赋能数字经济下的智能应用创新。





_1769672084863.jpg)