five
五号数据雷达
产品上架
产权登记
知识产权
公共数据
首页 / 数据知识产权登记 / 正文

发票识别算法模型训练数据已成功在浙江省数据知识产权登记平台进行登记,应用在发票识别、算法模型训练领域

五号数据雷达数据知识产权登记2025-10-25 04:0616
2025-10-24 , 湖州创感科技有限公司 旗下 发票识别算法模型训练数据 数据知识产权在 浙江省数据知识产权登记平台 完成登记 , 应用于 发票识别、算法模型训练 领域

湖州创感科技有限公司 本次登记的数据知识产权 发票识别算法模型训练数据, 发票识别算法模型训练数据主要应用于企业运营、税务管理和金融服务等多个领域,是数字化转型的重要支撑。在企业财务核算场景中,这项技术解决了传统人工录入效率低、易出错的痛点。企业通过使用发票识别算法模型可自动提取发票的关键信息,直接缩短报销和入账等流程,显著降低财务人员的重复劳动。电商企业面对海量电子发票,借助该模型能快速完成进项税抵扣核对,避免因漏报、错报导致的税务风险。税务部门通过该智能识别模型对企业上传的发票数据进行批量校验,自动比对发票信息与申报数据的一致性,精准筛查违规行为。从日常报销到税务稽查,从企业管理到金融风控,发票识别模型扮演了重要的角色,提升各领域的工作效率与合规水平。1、数据采集:通过企业现有发票和模拟发票等手段生成收集了大量发票文件,并利用技术手段获取各种票据样本,包括不同拍摄角度、不同布局和不同质量的票据,确保数据的多样性从而为提升模型的泛化能力做准备。生成每个文件的ID,记录发票的文件路径。 2、文件预处理:使用PyTorch进行文件预处理,初始化并设置合理参数、数据集训练集路径和测试集路径,再使用openCV进行轮廓检测,得到发票四个角的边界框坐标,对图片进行去噪、图像增强等步骤,进行透视变换重置图片坐标获得新的标准识别图片。 3、文件数据识别:识别区域个数,针对发票各个识别区域坐标、对标准识别图片各个信息区域使用PP-OCRv4进行文字识别,得到发票关键信息,对识别得到的信息再进行整合为json文件,保存文件至对应文件夹,字段信息为OCR识别结果。 4、模型训练:针对对应的YOLOv10模型训练过程中,将模型不断调整权重,固定学习率和批量大小的值,优化训练损失和验证损失,并且记录训练的训练时长。在训练过程中,模型的训练精度随着训练进度会逐步上升。 5、模型评估:使用测试集对模型进行评估,计算模型在不同的样本数据下识别的训练精度、召回率、F1值、以及实时性能评估等性能指标,确保了模型的准确性与适应性。 6、模型应用:将最终训练后得到的模型应用到实际具体的项目中。在实际应用中,再对模型的实时性能、检测的准确性和处理速度进行检测和评估,确保满足应用需求,以达到快速、准确识别的效果。

查看发票识别算法模型训练数据

登记内容:

 

关于 湖州创感科技有限公司 , 湖州创感科技有限公司是一家致力于技术服务、开发、咨询、交流、转让及推广的全方位科技型公司。其业务范围涵盖机械设备、电子元器件的研发与销售,还涉及金属制品、电子专用材料、新材料技术、机电耦合系统、五金产品、电机及其控制系统以及配电开关控制设备的研发工作。此外,公司在太赫兹检测技术、物联网技术方面也有深入研发,并提供专业设计与工业设计服务。近期,湖州创感科技有限公司在数据资源领域也取得了显著进展,其旗下的“地理信息行业高价值专利数据”和“德清县竹木产业联盟知识产权数据”已在浙江省数据知识产权登记平台完成登记,体现了公司在数据集领域的专业性和实力。

关于 浙江省数据知识产权登记平台 , 浙江省数据知识产权登记平台是一个专门用于登记和管理数据知识产权的官方平台。该平台允许企业和个人申请登记其数据知识产权,包括专利分类数据、客户价值评估数据等。平台提供公告功能,展示已登记、放弃或撤销的数据知识产权信息,并提供详细的申请人、申请时间和更新信息。

数据合作广告位

社区讨论

近期热门
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

二维码
关注我们