百融公司本次发布的数据集CoDeTT,CoDeTT是由百融公司BRVoice团队构建的面向对话系统回合制决策评估的多场景双语数据集,包含300小时中英文对话数据及14类细粒度决策标注。该数据集通过混合生成式与真实对话数据构建,覆盖系统活跃/闲置两种状态下的18,000条平衡样本,每条数据包含五轮历史对话上下文。其创新性地将传统边界检测扩展为结构化决策问题,为语音助手的自然交互、多模态对话系统等场景提供细粒度性能评估基准,解决了现有评测体系对语义意图与上下文关联性建模不足的痛点。
关于arXiv,全球最大的预印本学术论文数据库,涵盖物理、数学、计算机科学等多个学科领域。





_1769672084863.jpg)