阿姆斯特丹自由大学本次发布的数据集Cloud Incident Reports Dataset,该数据集由阿姆斯特丹自由大学等机构联合构建,收录了AWS、Azure和GCP三大云服务商2016-2024年间的3087份事故报告。数据集平均每份报告含500余词,包含服务名称、地理位置、时间戳等10类结构化字段,通过网页爬取和人工标注方式构建。研究团队采用K-means聚类抽样和多人交叉标注流程确保数据质量,该数据集可用于云计算可靠性分析、根因诊断等AIOps场景,为LLM在IT运维领域的结构化信息抽取提供基准测试资源。
查看Cloud Incident Reports Dataset
README内容:
关于阿姆斯特丹自由大学,阿姆斯特丹自由大学是荷兰的一所著名研究型大学,成立于1880年,以其在社会科学、法学和医学等领域的研究著称。
关于arXiv,全球最大的预印本学术论文数据库,涵盖物理、数学、计算机科学等多个学科领域。





_1769672084863.jpg)