five
五号数据雷达
产品上架
产权登记
知识产权
公共数据
首页 / 开源数据市场 / 正文

汉阳大学首发多节点可用性数据集 破解云计算现货实例稳定性预测痛点

五号数据雷达开源数据市场2026-04-29 04:5711
2026年4月27日,汉阳大学研究团队在预印本平台arXiv首发multi-node availability dataset多节点可用性数据集,通过创新采样技术突破云服务商API查询限制,覆盖127种实例类型的近6万条有效记录,可为云计算资源调度优化、分布式系统稳定性预判等场景提供关键数据支撑。

近年来,随着大模型训练、大规模分布式数据处理、云原生应用落地等算力需求持续爆发,云服务商推出的现货实例凭借较按需实例最高可达90%的成本优势,成为企业算力降本的核心选择。但现货实例存在被云服务商动态回收的特性,多节点并行运行时的可用性预判始终是行业共性痛点,此前公开领域长期缺乏覆盖多实例类型的大规模行为基准数据集,制约了云资源调度技术、分布式系统稳定性技术的迭代效率。

2026年4月27日,汉阳大学研究团队在预印本平台arXiv正式首发multi-node availability dataset多节点可用性数据集,聚焦云计算场景下多节点现货实例的可用性行为分析,为解决上述行业痛点提供了核心数据支撑。

据公开信息显示,该数据集累计收录59560条有效记录,覆盖127种独特实例类型,针对传统采集方式受限于云服务商API查询阈值、采集成本高、数据完整性不足的行业共性问题,研究团队创新开发了均匀间隔查询采样(USQS)和追踪分数转换点(TSTP)技术,在保障数据时间维度、实例类型维度全覆盖的前提下,大幅降低了API查询开销,攻克了大规模现货实例可用性数据高效采集的技术难关。

从应用价值来看,该数据集的落地场景覆盖云计算、分布式系统两大核心领域:在云计算资源管理场景,云服务商可基于该数据集优化现货实例的调度与回收策略,在保障自身资源利用率的同时降低用户任务中断概率;有大规模算力需求的市场主体,如AI训练厂商、大数据分析机构,可基于该数据集搭建混合实例集群调度模型,在使用现货实例降低算力成本的同时,提前预判节点回收风险,实现任务的无感动态迁移,避免核心业务中断带来的损失。在分布式系统稳定性预测场景,该数据集可为云原生应用、分布式存储、边缘计算集群等方向的故障预判模型训练提供基准数据,帮助技术团队提升分布式系统的高可用性设计能力,构建更稳定、性价比更高的分布式技术架构。

作为科研类公共数据资源的重要组成部分,该数据集的发布填补了公开领域多节点现货实例可用性行为研究的数据空白,不仅为后续相关学术研究提供了统一的基准测试数据集,也为云服务产业的技术迭代、企业算力成本优化提供了实际支撑,对推动分布式云计算产业的高质量发展、完善数据要素市场的科研数据供给体系具有积极意义。

查看multi-node availability dataset

详情页内容:

数据合作广告位

社区讨论

近期热门
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

二维码
关注我们