北京大学人工智能研究院 本次发布的数据集 EuroCon, EuroCon是一个由欧洲议会13年(2009年至2022年)内2,225条高质量辩论记录构成的基准,旨在评估大型语言模型(LLMs)在政治共识达成方面的能力。数据集涵盖了第七届和第八届议会的整个任期,以及第九届议会任期的一半。EuroCon结合了四个因素来构建每个模拟议会环境:具体的政治问题、政治目标、参与方以及基于席位分配的权力结构。它还开发了一个评估框架,以模拟不同议会环境下的真实投票结果,评估LLM生成的决议是否达到预定的政治目标。EuroCon作为研究LLMs在寻找政治共识方面的能力的一个有效平台,展现出巨大的潜力。
关于 北京大学人工智能研究院 , 北京大学人工智能研究院是北京大学下属的研究机构,专注于人工智能领域的基础研究和应用开发,涵盖了机器学习、计算机视觉、自然语言处理等多个研究方向。
关于 arXiv , arXiv 是一个免费分发服务和开放获取的学术文章档案库,涵盖了物理学、数学、计算机科学、定量生物学、定量金融、统计学、电气工程和系统科学以及经济学等领域。该网站上的材料并未经过 arXiv 的同行评审。





_1769672084863.jpg)