University of Florida 本次发布的数据集 Verifiable Linear Temporal Logic Benchmark (VLTL-Bench), VLTL-Bench是一个用于评估自然语言(NL)到线性时态逻辑(LTL)翻译系统的统一基准数据集,旨在衡量翻译的可验证性和正确性。该数据集包含三个独特的状态空间和数千个多样化的自然语言规范及其对应的时态逻辑规范,并提供样本跟踪以验证时态逻辑表达式。VLTL-Bench支持端到端评估,并提供每个步骤的真实值,以便研究人员改进和评估整个问题的不同子步骤。该数据集对于推动NL到LTL翻译领域的方法论研究具有重要意义。
查看Verifiable Linear Temporal Logic Benchmark (VLTL-Bench)
关于 University of Florida , 佛罗里达大学(University of Florida)是一所位于美国佛罗里达州盖恩斯维尔的公立研究型大学,是佛罗里达大学系统中的旗舰学校,提供多种本科和研究生课程。
关于 arXiv , arXiv 是一个免费分发服务和开放获取的学术文章档案库,涵盖了物理学、数学、计算机科学、定量生物学、定量金融、统计学、电气工程和系统科学以及经济学等领域。该网站上的材料并未经过 arXiv 的同行评审。





_1769672084863.jpg)