Lehigh University 本次发布的数据集 AWAREEVAL, AWAREEVAL数据集由Lehigh University创建,旨在通过包含二元、多选和开放式问题来评估大型语言模型(LLMs)在五个意识维度上的表现:能力、使命、情感、文化和视角。该数据集通过多种问题类型全面了解LLMs的行为,特别关注LLMs在理解自身作为AI模型身份、识别其能力和使命以及展示社会智能方面的能力。AWAREEVAL的应用领域涉及AI对齐和安全性,强调了在可信和伦理发展中LLMs意识的重要性。
README 内容:
关于 Lehigh University , Lehigh University是一所位于美国宾夕法尼亚州的私立研究型大学,成立于1865年。该校以其工程、商业和艺术与科学学院而闻名,尤其在工程和材料科学领域具有较高的学术声誉。
关于 arXiv , arXiv 是一个免费分发服务和开放获取的学术文章档案库,涵盖了物理学、数学、计算机科学、定量生物学、定量金融、统计学、电气工程和系统科学以及经济学等领域。该网站上的材料并未经过 arXiv 的同行评审。





_1769672084863.jpg)