five
五号数据雷达
产品上架
产权登记
知识产权
公共数据
首页 / 开源数据市场 / 正文

开罗大学联合苏黎世联邦理工发布FactoryNet工业时序数据集 填补工业基础模型训练数据空白

五号数据雷达开源数据市场2026-05-15 08:0013
开罗大学联合苏黎世联邦理工学院等机构于2026年5月13日在预印本平台arXiv首发FactoryNet大规模工业时序数据集,通过首创的统一信号分类法标准化异构工业数据,解决了工业AI领域长期缺乏结构化时序训练基板的核心痛点,可广泛应用于工业异常检测、基础模型预训练等核心场景。

当前全球制造业正处于数字化转型的关键阶段,工业人工智能作为提升产线运营效率、降低生产运维成本的核心技术,其规模化落地进程长期受限于工业数据的碎片化、异构化痛点:不同工业场景的传感器、控制器、生产设备输出的信号标准不统一,且此前行业内缺乏大规模、结构化的公共时序数据集作为训练基底,导致工业基础模型的通用性不足、小样本场景下的模型训练成本居高不下,制约了工业AI的普及速度。2026年5月13日,开罗大学联合苏黎世联邦理工学院等机构在预印本平台arXiv首发FactoryNet数据集,作为全球首个面向工业时间序列基础模型的大规模预训练数据集,该成果一经发布即引发工业AI领域的广泛关注。

据发布方公开信息显示,FactoryNet数据集共包含约23000个端到端任务执行序列,覆盖5100万个数据点,数据来源整合了真实工业实验室的实测记录与高仿真合成数据。为解决多模态工业信号的统一标注难题,研发团队首创设定点-作用力-反馈-上下文(S-E-F-C)信号分类法,通过程序化映射将300多个异构数据列标准化为四类符合控制理论逻辑的角色,同时借助NVIDIA Isaac Sim仿真平台完成合成数据生成与领域随机化,覆盖了更多真实生产场景中出现概率极低的异常工况,大幅提升了数据集的场景适配性与泛用性。

从应用方向来看,FactoryNet可广泛支撑三大类工业AI场景的技术研发:一是工业时序异常检测,基于该数据集训练的异常识别模型可适配离散制造、流程工业等多类场景的设备运维需求,实现电机、传感器、控制单元等核心部件的故障提前预警,帮助生产企业降低非计划停机带来的生产损失;二是跨设备动态迁移学习,依托标准化的数据集结构,研发人员无需针对不同产线、不同品牌的设备单独标注海量训练数据,可大幅降低工业AI模型的落地成本与部署周期;三是工业基础模型预训练,作为目前行业内规模最大、标准化程度最高的工业时序公共数据集,FactoryNet可作为通用训练基板,支撑通用工业大模型的预训练研发,填补了此前该领域的核心供给空白。

该数据集的发布也为工业数据要素的标准化治理与流通提供了参考样本,通过统一的分类框架实现异构工业数据的结构化处理,能够为后续公共工业数据集的构建、工业数据的跨主体共享流通提供可复制的路径,对推动工业AI规模化落地、加速实体经济数字化转型具有重要的行业价值。

查看FactoryNet

Dataset card内容:

Files and versions内容:

数据合作广告位

社区讨论

近期热门
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

二维码
关注我们