NVlabs 本次发布的数据集 FVEval, 该数据集名为FVEval,是首个全面评估框架,旨在表征大型语言模型(LLM)在数字硬件设计中的形式验证(FV)相关任务上的性能。该基准测试包含了生成SystemVerilog断言和对设计寄存器传输级(RTL)进行推理的任务,并提供全面和部分功能等价的度量标准。该数据集涵盖了广泛现有的LLM,包括专有和开源模型。其任务之一是评估语言模型根据自然语言描述生成SystemVerilog断言的能力。
README 内容:
关于 arXiv , arXiv 是一个免费分发服务和开放获取的学术文章档案库,涵盖了物理学、数学、计算机科学、定量生物学、定量金融、统计学、电气工程和系统科学以及经济学等领域。该网站上的材料并未经过 arXiv 的同行评审。





_1769672084863.jpg)