北京大学本次发布的数据集ReqElicitBench,ReqElicitBench是由北京大学团队主导构建的对话式需求启发评估数据集,包含101个网站需求场景,覆盖10种应用类型。该数据集通过建模初始需求、隐含需求和最终需求的差距,为自动化评估提供基准。数据采用GPT-5.1模拟真实用户交互生成,经555轮真实对话验证,与专家判断的一致性系数达0.72。该数据集支持LLM在软件工程领域的需求挖掘能力量化评估,尤其针对隐式需求的识别效率和多轮对话策略分析。
README内容:
关于北京大学,北京大学是中国著名的综合性研究型大学,创建于1898年,前身为京师大学堂。学校位于北京市,是中国顶尖的高等学府之一,在国内外享有极高声誉,涵盖文、理、工、医等多个学科领域。
关于arXiv,arXiv 是一个免费分发服务和开放获取的学术文章档案库,涵盖了物理学、数学、计算机科学、定量生物学、定量金融、统计学、电气工程和系统科学以及经济学等领域。该网站上的材料并未经过 arXiv 的同行评审。





_1769672084863.jpg)