腾讯人工智能实验室 本次发布的数据集 Voice Chat Bot Bench (VCB Bench), VCB Bench是一个高质量的中文评估基准,完全基于真实的人声构建。它从三个互补的视角评估大型音频语言模型(LALMs):指令遵循(包括超越文本命令的语音级别控制)、知识理解和鲁棒性(在内容、环境和说话者特征方面的干扰下保持稳定性)。该数据集包含来自第三方专业录音、综艺节目问答片段和内部策划的两人对话数据集的数据。VCB Bench为推动中文语音对话模型的进步提供了可重复和细粒度的评估框架,为模型改进提供了标准化方法和实用见解。
查看Voice Chat Bot Bench (VCB Bench)
关于 腾讯人工智能实验室 , 腾讯人工智能实验室是腾讯公司旗下的研究机构,专注于人工智能的基础研究和技术应用,致力于推动AI技术的发展和应用。
关于 arXiv , arXiv 是一个免费分发服务和开放获取的学术文章档案库,涵盖了物理学、数学、计算机科学、定量生物学、定量金融、统计学、电气工程和系统科学以及经济学等领域。该网站上的材料并未经过 arXiv 的同行评审。





_1769672084863.jpg)