Synechron 本次发布的数据集 Custom Bar Chart Dataset, 该数据集由Synechron创建,包含50,000个条形图,涵盖简单、堆叠和分组三种类型,专为金融领域的图表分析设计。数据集通过随机化标题、轴标签、类别和数值等元素,确保多样性和代表性。每个图表均配有结构化的JSON文件,包含图表的文本描述,作为模型训练的真实标签。数据集生成过程使用Python的Matplotlib和Seaborn库,确保图表的多样性和复杂性。该数据集主要用于训练和评估DEPLOT模型,提升其在金融图表中的数值和类别映射能力,旨在解决自动化图表解析中的精度和泛化问题。
关于 Synechron , Synechron是一家全球性的数字、业务咨询和技术服务公司,专注于金融服务、保险、医疗保健和生命科学等行业。公司提供包括数字化转型、数据分析、人工智能、区块链和云计算等服务。
关于 arXiv , arXiv 是一个免费分发服务和开放获取的学术文章档案库,涵盖了物理学、数学、计算机科学、定量生物学、定量金融、统计学、电气工程和系统科学以及经济学等领域。该网站上的材料并未经过 arXiv 的同行评审。





_1769672084863.jpg)