根特大学 本次发布的数据集 Word Synchronization Challenge, Word Synchronization Challenge是一个新颖的基准测试,用于评估大型语言模型在人类计算机交互(HCI)中的单词关联响应能力。该基准测试采用动态游戏框架模拟复杂的人类交互,以评估LLM在对话交流中解释和匹配人类思维模式的能力。通过模拟两模型间的单词关联游戏,生成了一个综合数据集,记录了模型间的单词交换历史和游戏结果,旨在为评估模型在单词关联同步任务中的表现提供依据。
查看Word Synchronization Challenge
关于 根特大学 , 根特大学(University of Ghent)是位于比利时弗拉芒大区根特市的一所研究型大学,成立于1817年,是比利时最大的大学之一,以其高质量的教育和研究在国际上享有声誉。
关于 arXiv , arXiv 是一个免费分发服务和开放获取的学术文章档案库,涵盖了物理学、数学、计算机科学、定量生物学、定量金融、统计学、电气工程和系统科学以及经济学等领域。该网站上的材料并未经过 arXiv 的同行评审。





_1769672084863.jpg)