five
五号数据雷达
产品上架
产权登记
知识产权
公共数据
首页 / 开源数据市场 / 正文

欧特克研究院发布百万级Zero-to-CAD数据集 破解AI辅助工业设计训练数据瓶颈

五号数据雷达开源数据市场2026-04-29 04:56135
全球设计软件龙头欧特克研究院于2026年4月27日在arXiv首发百万级可执行CAD程序数据集Zero-to-CAD,填补了传统B-Rep格式CAD数据缺失设计意图的行业空白,为CAD程序自动生成、AI辅助机械设计等领域的大模型研发提供核心训练资源支撑。

近年来,随着生成式AI技术向工业制造场景深度渗透,AI辅助机械设计、自动化三维建模等创新应用成为推动制造业数字化转型的重要抓手,但该领域长期面临高质量训练数据供给不足的核心痛点:传统CAD数据集多以B-Rep(边界表达)格式的最终三维模型为主,仅存储静态几何形态信息,缺失从0到1的建模步骤序列、参数调整逻辑与背后的设计意图,严重限制了大模型对工业设计逻辑的学习能力,也成为AI设计落地的核心障碍。

2026年4月27日,全球设计软件龙头欧特克旗下研究院在arXiv平台首发百万级可执行CAD程序数据集Zero-to-CAD,直击上述行业痛点。作为深耕工程建设、制造业、传媒娱乐等领域设计软件数十年的龙头企业,欧特克在CAD技术领域拥有深厚的技术积累,其研究院发布的相关数据资源普遍具备极强的行业权威性与落地参考价值。

据官方披露,Zero-to-CAD是目前行业内规模领先的可执行CAD程序数据集,采用基于大语言模型的智能体搜索框架合成,覆盖布尔运算、倒角、放样等数十种工业设计场景下的高频操作,全量数据集包含约100万条参数化构建序列,同时配套10万条经过多轮筛选的高价值精选子集,所有数据均经过代码执行验证,确保几何形态的有效性与可落地性。与传统B-Rep数据集相比,Zero-to-CAD最大的创新价值在于填补了“设计意图缺失”的行业空白:其合成过程结合了专业级提示工程与机械设计文档检索能力,支持从零生成可读性强、可编辑性高的CAD代码,完整还原了从空白文档到完整三维模型的全流程设计逻辑,而非仅输出最终的静态几何结果。

从应用价值来看,该数据集可为CAD程序自动生成、AI辅助机械设计相关的大模型训练提供高质量标注资源,潜在应用方向覆盖图像到CAD序列重建、智能建模步骤补全、设计参数自动优化、数字孪生场景零部件快速生成等多个工业场景,也可为工业设计类职业教育、智能CAD软件功能迭代提供基础数据支撑,有望进一步降低AI+工业设计领域的研发门槛,推动生成式AI在制造业的落地进程。

查看Zero-to-CAD

Dataset card内容:

Files and versions内容:

数据合作广告位

社区讨论

近期热门
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

二维码
关注我们