Allen Institute for AI本次发布的数据集Dolci-Think-SFT-Olmo-Hybrid-Tool-Use-SA,Dolci Think SFT Olmo Hybrid Tool Use SA 是一个专为工具使用研究设计的多轮对话数据集,采用 CC-BY-SA-4.0 许可协议。数据集包含 1,597 个训练样本(总大小 39.9MB),每个样本具有以下结构化特征:唯一标识符(id)、数据来源(source)、步骤数(n_step)、对话轮数(n_turn)、是否拒绝(is_refusal布尔值)、执行类型(exec_type)以及消息列表(messages)。消息列表中每条消息包含内容(content)、函数调用(function_calls)、函数定义(functions)和发言角色(role)字段。该数据集特别适用于研究对话系统中工具调用的拒绝行为和执行类型分类任务,主要面向教育和研究用途,需遵循责任使用准则。
查看Dolci-Think-SFT-Olmo-Hybrid-Tool-Use-SA
关于Allen Institute for AI,艾伦人工智能研究所是一家专注于AI研究和应用的高级研究机构。
关于HuggingFace,Hugging Face是一个机器学习社区协作平台,专注于模型、数据集和应用程序的创建、发现和协作。该平台支持多种数据类型,包括文本、图像、视频、音频和3D数据,并提供开源工具和付费计算及企业解决方案。





_1769672084863.jpg)