Federal University of ABC 本次发布的数据集 Virology Capabilities Test (VCT), VCT是一个由数十位博士级别病毒学专家共同构建的大型语言模型基准测试,包含322个涵盖病毒学实验室实践工作中基础、内隐和视觉知识的多模态问题。这些问题旨在测试LLM对双用途病毒学实验室协议的故障排除能力,并对专家级别的病毒学知识进行验证。数据集由具有丰富经验的病毒学专家创建并审核,涵盖了实验故障排除、实验方法等多个方面,应用于评估大型语言模型在病毒学领域中的实际应用能力。
查看Virology Capabilities Test (VCT)
关于 arXiv , arXiv 是一个免费分发服务和开放获取的学术文章档案库,涵盖了物理学、数学、计算机科学、定量生物学、定量金融、统计学、电气工程和系统科学以及经济学等领域。该网站上的材料并未经过 arXiv 的同行评审。





_1769672084863.jpg)