北京大学本次发布的数据集GeoBuildBench,GeoBuildBench是由北京大学和王选计算机研究所联合构建的几何构造基准数据集,旨在评估大语言模型和多模态智能体将自然语言几何问题转化为可执行几何构造的能力。该数据集包含489道源自GeoQA及在线教科书资源的中文平面几何题目,每条数据均标注了必需几何对象和可验证的几何约束条件,通过自动化过滤和人工验证确保文本完备性与构造可行性。数据集采用三阶段构建流程:首先基于GPT-4.1进行文本可构造性筛选与清洗,随后提取结构化任务表示,最后通过数学专业人员进行几何可实现性验证。该数据集主要应用于几何推理、多模态交互系统及可执行程序生成研究领域,致力于解决自然语言到几何结构的精准转换与约束满足问题。





_1769672084863.jpg)