The Fin AI本次发布的数据集Herculean,Herculean 是一个用于评估执行金融分析任务的 LLM 智能体的离线基准测试数据集,包含五种金融分析任务:交易、对冲、报告生成、报告评估和 XBRL 文件审计。数据集由两部分组成:1) 一个 DuckDB 数据库(及对应的 Parquet 文件),包含 8 只美国大型科技股(AAPL、ADBE、AMZN、GOOGL、META、MSFT、NVDA、TSLA)在 2024-12-01 至 2026-03-31 期间的每日价格、新闻摘要和 10-K/10-Q 文件摘录;2) 一个审计环境,包含 158 份 SEC XBRL 文件(10-K 和 10-Q,2021-2023 财年)及完整的实例文档和链接库,以及分块的 US-GAAP 分类标准(2021-2024)和包含 4,959 个数学一致性断言的 ground-truth 文件。数据集适用于多日、使用工具的金融任务基准测试和 XBRL 数字事实审计,但不适用于实时交易、预测或作为财务建议语料库。数据集包含价格、新闻和文件三个表,分别有 2,656、3,888 和 73 行数据。数据集采用 CC BY 4.0 许可,部分内容为美国联邦政府公共领域内容。





_1769672084863.jpg)