five
五号数据雷达
产品上架
产权登记
知识产权
公共数据
首页 / 开源数据市场 / 正文

约翰斯·霍普金斯联合亚马逊研究院发布DyadEE数据集 填补双人情感同步检测基准空白

五号数据雷达开源数据市场2026-07-01 04:055
约翰斯·霍普金斯大学联合亚马逊研究院于2026年6月30日在学术预印本平台arXiv首发双人语音情感交互数据集DyadEE,该数据集包含8500组标注对话样本,覆盖14类情感对话场景,可为语音AI情感感知能力迭代、社交场景多模态交互技术研发提供标准化评估支撑。

随着通用人工智能与语音交互技术的快速落地,情感感知能力已经成为下一代人机交互产品的核心竞争力,但长期以来,面向双人对话场景下的情感同步识别研究始终缺少高质量标注数据集与统一评估基准,制约了语音AI在情感敏感场景的落地效果。近日,约翰斯·霍普金斯大学联合亚马逊研究院正式发布DyadEE双人语音交互专项数据集,瞄准对话中情感协调的动态过程研究需求,为计算副语言学领域的情感同步检测方向提供了全新的研究底座。

据公开信息显示,DyadEE数据集共包含8500个对话样本,总时长暂未公开标注,原始数据源自开源Seamless Interaction语料库,研发团队通过人工筛选结合GPT-5辅助分类,抽象出14种情感丰富的对话上下文类别。为了构建更具参考性的训练与评估样本,团队在数据集生产过程中采用了语音转换、去噪增强、伙伴交换、情感矛盾重合成等多重策略,同步构建了情感同步与非同步两类对比样本,实现了关系属性、对话上下文的双重约束标注,大幅提升了数据集的研究适配性,核心目标是解决语音AI在情感敏感场景中如何适配社交角色、匹配对话上下文的行业共性问题。

从产业应用来看,DyadEE数据集的落地应用空间十分广泛:在智能客服场景,可支撑AI模型识别客服与用户的情感同步程度,优化话术策略,提升问题解决率与用户满意度;在AI心理咨询、虚拟陪伴等场景,可助力训练AI感知与交互对象的情感共振状态,动态调整沟通节奏,提升情感服务的有效性;在车载交互、元宇宙虚拟人等场景,也可为多模态交互模型提供训练数据支撑,推动人机交互从「指令响应」向「共情交互」升级。

作为当前全球数据要素市场中稀缺的垂直类情感交互专项数据集,DyadEE的发布填补了双人情感同步检测领域的标准化评估空白,为全球学界、产业界的情感类AI技术研发提供了统一的基准标尺,对推动语音交互技术向更高阶的人性化方向发展具有重要的行业价值。

查看DyadEE

详情页内容:

数据合作广告位

社区讨论

近期热门
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

二维码
关注我们