five
五号数据雷达
产品上架
产权登记
知识产权
公共数据
首页 / 开源数据市场 / 正文

The Fin AI发布Herculean数据集,应用在XBRL文件审计、金融分析基准测试领域

五号数据雷达开源数据市场2026-05-05 04:0618
Herculean是The Fin AI发布的数据集,于2026-05-04首发在HuggingFace应用于XBRL文件审计、金融分析基准测试领域

The Fin AI本次发布的数据集Herculean,Herculean 是一个用于评估执行金融分析任务的 LLM 智能体的离线基准测试数据集,包含五种金融分析任务:交易、对冲、报告生成、报告评估和 XBRL 文件审计。数据集由两部分组成:1) 一个 DuckDB 数据库(及对应的 Parquet 文件),包含 8 只美国大型科技股(AAPL、ADBE、AMZN、GOOGL、META、MSFT、NVDA、TSLA)在 2024-12-01 至 2026-03-31 期间的每日价格、新闻摘要和 10-K/10-Q 文件摘录;2) 一个审计环境,包含 158 份 SEC XBRL 文件(10-K 和 10-Q,2021-2023 财年)及完整的实例文档和链接库,以及分块的 US-GAAP 分类标准(2021-2024)和包含 4,959 个数学一致性断言的 ground-truth 文件。数据集适用于多日、使用工具的金融任务基准测试和 XBRL 数字事实审计,但不适用于实时交易、预测或作为财务建议语料库。数据集包含价格、新闻和文件三个表,分别有 2,656、3,888 和 73 行数据。数据集采用 CC BY 4.0 许可,部分内容为美国联邦政府公共领域内容。

查看Herculean

Dataset card内容:

 

Files and versions内容:

 

数据合作广告位

社区讨论

近期热门
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

二维码
关注我们