Univ Rennes 本次发布的数据集 vTikZ, vTikZ数据集是一个专门用于评估大型语言模型(LLMs)在代码定制方面能力的基准数据集。该数据集包含100个精心策划的TikZ编辑场景,每个场景都需要对代码进行修改以实现指定的视觉变化。vTikZ数据集由人类创建的TikZ代码变体组成,每个变体都是从一个原始的TikZ代码中衍生出来的,并附有相应的编辑指令。数据集还包括参数化的地面真实情况,以应对多个代码变体可能正确实现给定的视觉修改的问题。此外,数据集还包括一个视觉审查工具,用于评估生成的视觉结果。vTikZ数据集旨在解决代码定制与视觉结果的一致性问题,为多模态人工智能辅助编程的未来研究铺平了道路。
Dataset card 内容:
Files and versions 内容:
关于 arXiv , arXiv 是一个免费分发服务和开放获取的学术文章档案库,涵盖了物理学、数学、计算机科学、定量生物学、定量金融、统计学、电气工程和系统科学以及经济学等领域。该网站上的材料并未经过 arXiv 的同行评审。





_1769672084863.jpg)