中国人民大学本次发布的数据集TRUSTMH-BENCH,TRUSTMH-BENCH是由中国人民大学等机构联合构建的心理健康领域大语言模型可信度评估基准,包含1,339条临床标注对话数据。该数据集整合了D4抑郁评估对话、SWMH精神障碍分类等专业资源,通过知识问答、情感识别、危机干预等八维指标体系,系统评估模型在临床可靠性、隐私保护、反谄媚等方面的表现。其构建过程严格遵循美国医学执照考试(USMLE)标准和哥伦比亚自杀风险评估量表(C-SSRS)等临床规范,旨在解决心理健康AI应用中存在的伦理边界模糊、危机响应不足等关键信任问题。
关于中国人民大学,中国人民大学是中国共产党创办的第一所新型正规大学,是一所以人文社会科学为主的综合性研究型全国重点大学,直属于教育部。
关于arXiv,arXiv 是一个免费分发服务和开放获取的学术文章档案库,涵盖了物理学、数学、计算机科学、定量生物学、定量金融、统计学、电气工程和系统科学以及经济学等领域。该网站上的材料并未经过 arXiv 的同行评审。





_1769672084863.jpg)