Declare Lab 本次发布的数据集 INSTRUCTEVAL, 该数据集是一个专为指令微调大型语言模型设计的综合评估套件,它不仅评估模型的问题解决能力,还考察其写作能力以及对人类价值观的契合度。该数据集包含多种任务,旨在评估模型的写作能力以及与人类价值观的一致性,强调了指令微调数据在模型性能中的重要性。这项任务的目的是对指令微调后的大型语言模型进行评估。
README 内容:
关于 arXiv , arXiv 是一个免费分发服务和开放获取的学术文章档案库,涵盖了物理学、数学、计算机科学、定量生物学、定量金融、统计学、电气工程和系统科学以及经济学等领域。该网站上的材料并未经过 arXiv 的同行评审。





_1769672084863.jpg)