微软 本次发布的数据集 Financial Reports Numerical Extraction (FINE), FINE数据集是由微软、北京大学和中国科学院软件研究所等机构共同创建的,专门用于从混合长文档中提取财务关键绩效指标(KPIs)。该数据集基于SEC的EDGAR系统,包含了大量财务报告数据,旨在解决大语言模型在处理混合文本和表格数据时的信息提取问题。数据集通过自动化信息提取框架(AIE)进行处理,能够有效支持财务分析等领域的应用。
查看Financial Reports Numerical Extraction (FINE)
关于 微软 , 微软(Microsoft)是一家全球领先的科技公司,成立于1975年,总部位于美国华盛顿州雷德蒙德。微软以开发、制造、许可、支持和销售计算机软件、消费电子产品、个人电脑和相关服务而闻名,其最著名的产品包括Windows操作系统、Office办公软件套件和Azure云计算服务。
关于 arXiv , arXiv 是一个免费分发服务和开放获取的学术文章档案库,涵盖了物理学、数学、计算机科学、定量生物学、定量金融、统计学、电气工程和系统科学以及经济学等领域。该网站上的材料并未经过 arXiv 的同行评审。





_1769672084863.jpg)