中山大学 本次发布的数据集 OmniGIRL, OmniGIRL是一个多语言、多模态和多领域的GitHub问题解决基准数据集,包含来自四种编程语言(Python、JavaScript、TypeScript和Java)和八个不同领域的959个任务实例。该数据集不仅包含了文本信息,还包括了图像等多模态信息,旨在评估大型语言模型在解决GitHub问题方面的能力。数据集的创建过程包括了语言和仓库的选择、拉取请求数据的收集、任务实例的构建、基于执行的验证以及不必要的图像过滤等五个阶段。OmniGIRL数据集的应用领域主要在于评估和提升大型语言模型在解决GitHub问题方面的能力,旨在解决当前大型语言模型在多语言、多模态和多领域问题解决方面的局限性。
关于 中山大学 , 中山大学是一所综合性大学,致力于培养高等学历人才和推动科技文化发展,涵盖了哲学、文学、历史学、经济学、管理学、医学、政治学、法学、生物学、理工类和语言学等多个学科领域,提供从高等专科到博士研究生的全方位学历教育。在数据领域,中山大学也取得了显著进展,其天河二号超算服务和星光超算应用平台的数据产品于2023年7月6日在广州数据交易所成功挂牌,这标志着中山大学在数据科技和超算服务方面的实力和成果得到了市场的认可,为相关领域的研究和应用提供了强有力的支持。
关于 arXiv , arXiv 是一个免费分发服务和开放获取的学术文章档案库,涵盖了物理学、数学、计算机科学、定量生物学、定量金融、统计学、电气工程和系统科学以及经济学等领域。该网站上的材料并未经过 arXiv 的同行评审。





_1769672084863.jpg)