five
五号数据雷达
产品上架
产权登记
知识产权
公共数据
首页 / 开源数据市场 / 正文

U.S. Securities and Exchange Commission (SEC) 发布 Form 10-K Filings 数据集, 应用在 财务报告、自然语言处理 领域

五号数据雷达开源数据市场2025-10-04 00:1718
Form 10-K Filings 是 U.S. Securities and Exchange Commission (SEC) 发布的数据集,于 2025-10-03 首发在 arXiv 应用于 财务报告、自然语言处理 领域

U.S. Securities and Exchange Commission (SEC) 本次发布的数据集 Form 10-K Filings, 该数据集包含了1000份HTML格式的10-K表格文件,这些文件是美国证券交易委员会(SEC)要求的公司全面年度报告,详细阐述了公司的财务状况、业务概览及其他必须披露的信息。特别关注的是第7项,“管理层对财务状况及经营成果的分析讨论”(MD&A)。此外,该数据集还包含了报告的原始版本和打乱版本,以探索大型语言模型(LLMs)中的位置偏见问题。该数据集的规模为1000份报告,任务是对这些内容进行摘要总结。

查看Form 10-K Filings

README 内容: 

 

关于 U.S. Securities and Exchange Commission (SEC) , 美国证券交易委员会(SEC)是美国联邦政府的一个独立机构,负责监管证券市场,确保市场的公平、透明,并保护投资者的利益。

关于 arXiv , arXiv 是一个免费分发服务和开放获取的学术文章档案库,涵盖了物理学、数学、计算机科学、定量生物学、定量金融、统计学、电气工程和系统科学以及经济学等领域。该网站上的材料并未经过 arXiv 的同行评审。

数据合作广告位

社区讨论

近期热门
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

二维码
关注我们