Databricks本次发布的数据集OfficeQA Pro,OfficeQA Pro是由Databricks人工智能研究院构建的企业级基准测试数据集,基于近百年美国财政部公报构建,包含89,000页文档和2600万数值数据。数据集包含133个需跨文档解析与数值推理的问题,涵盖表格解析、时序分析等复杂任务。通过专业标注团队与AI验证流程构建,旨在评估AI模型在真实企业环境中的多模态推理能力,尤其关注金融数据分析场景下的检索与计算精度。
关于Databricks,Databricks是一家美国企业软件公司,专注于数据和人工智能领域,提供基于Apache Spark的统一数据分析平台。该公司由Apache Spark的原始创建者于2013年创立,总部位于加利福尼亚州旧金山。
关于arXiv,全球最大的预印本论文库,涵盖物理学、数学、计算机科学等多个学科领域。





_1769672084863.jpg)