首页 / 开源数据市场 / 正文

哈工大首发ENPMR-Bench中文基准数据集赋能情感支持对话与记忆增强检索技术研发

五号数据雷达开源数据市场2026-05-28 11:4315

2026年5月27日，哈尔滨工业大学社会计算与人机交互研究中心在arXiv首发中文ENPMR-Bench基准数据集，该数据集聚焦情感支持对话场景的主动记忆检索能力评估，将为中文情感计算、对话系统领域的技术研发提供标准化测评工具。

近年来，随着大语言模型技术的商业化落地，情感陪伴机器人、智能心理咨询助手、个性化数字人等人文交互类应用快速普及，但长期对话场景下智能体普遍存在的记忆遗忘、情感需求感知偏差、共情回应能力不足等问题，已经成为制约相关场景用户体验提升的核心痛点。而此前中文领域缺乏标准化的、面向情感需求感知的主动记忆检索能力评估基准数据集，导致不同机构研发的相关算法难以开展横向对标，大幅拖慢了技术迭代效率。

在此背景下，哈尔滨工业大学社会计算与人机交互研究中心正式发布ENPMR-Bench数据集。作为国内深耕社会计算、情感计算与人机交互领域的顶尖研究团队，哈工大该团队长期聚焦人机交互场景下的用户情感认知、智能体共情能力构建等方向的研究，本次发布的数据集正是其在该领域的最新成果，旨在系统评估情感需求感知的主动记忆检索能力。该数据集包含1,872个记忆增强的情感支持对话，覆盖11,846条记忆条目，涵盖生理需求、爱与归属、自尊及自我实现四大需求维度，数据来源于基于用户画像和生命主题生成的合成对话，从源头避免了真实用户隐私泄露的风险。其构建过程以马斯洛需求层次理论为指导，通过专家设计的结构化检索框架，将记忆条目分类为高光时刻、能力、关系、目标和偏好五类，并按照时间线组织成连贯的会话历史，最大程度还原了真实长期情感交互的场景特征。该数据集主要应用于情感计算和对话系统领域，旨在解决长期情感支持场景中，智能体如何主动推断用户潜在情感需求并检索恰当记忆以提供共情交互的核心问题。

从应用价值来看，该数据集可覆盖多个垂直场景的技术研发需求：面向独居老人的智能陪伴产品研发，可依托该数据集测试智能体对老人既往病史、家人关系、生活习惯等记忆的调用准确率，提升陪伴交互的温度与实用性；面向青少年的心理疏导智能助手，可基于该数据集优化对用户过往负面经历、成长目标等记忆的检索逻辑，避免重复提问引发用户抵触，同时给出更具针对性的共情回应；此外，该数据集还可为记忆增强检索算法的性能测评提供统一基准，帮助不同研究机构横向对比算法优劣势，加快相关技术的迭代效率。本次数据集的发布也进一步丰富了国内人工智能垂直领域的高质量数据要素供给，对于推动大语言模型在人文关怀类场景的落地、提升智能交互产品的用户体验具有重要的支撑作用。

查看ENPMR-Bench

详情页内容：

社区讨论

近期热门

哈工大首发ENPMR-Bench中文基准数据集 赋能情感支持对话与记忆增强检索技术研发

详情页内容：

社区讨论

哈工大首发ENPMR-Bench中文基准数据集赋能情感支持对话与记忆增强检索技术研发