浙江由由科技有限公司 本次登记的数据知识产权 生鲜商品AI训练识别质量评估数据, 本数据集形成了包括627种蔬菜、水果、禽肉、水产的经分类的图片训练集,该数据集将用于人工智能模型的训练,形成可以根据照片内容识别出照片中包含商品的智能模型。该模型可广泛应用于生鲜商场、超市的收银场景,直接通过摄像头拍照后识别出商品类型,省去原来需要人工识别商品并输入收银系统的繁琐步骤。1.数据收集:本数据集收集了2020年1月1日至2022年5月1日期间涉及627种蔬菜、水果、禽肉、水产的大量实物实拍照片,本数据集归属于申请人浙江由由科技有限公司。2.算法说明:第一步,先将627种不同商品的名称录入系统,为每一个商品确定唯一的编码,并为每一个名称商品建立训练集。第二步,以专家经验,依据每个商品的常见程度确定优先级,对于常见的品类给予较高的优先级,以此类推,使得优先级顺序:A+>A>B>C。第三步,根据专家经验和专业知识,为每一个产品添加特征描述,描述商品的特点,以帮助提供人工区分时的准确性。第四步,以专家经验和人工判断,参考特征描述,将收集来的照片分类分入不同商品名称下的训练集,例如,专家根据专业经验判断照片中的商品属于葱苗,然后将照片放入葱苗名称对应下的训练集。第五步,在所有照片归入对应的训练集后,统计形成训练集数目,代表该训练集中商品图片的数量。第六步,根据优先级和训练集数目计算出数据置信度等级。对于优先级为A+的商品,当训练集数目≥20000时,为非常高阈值,当训练集数目≥10000时,为高阈值,当训练集数目≥5000时,为中等阈值,当训练集数目<5000时,为低阈值;对于优先级为A的商品,当训练集数目≥15000时,为非常高阈值,当训练集数目≥8000时,为高阈值,当训练集数目≥4000时,为中等阈值,当训练集数目<4000时,为低阈值;对于优先级为B的商品,当训练集数目≥10000时,为非常高阈值,当训练集数目≥5000时,为高阈值,当训练集数目≥2500时,为中等阈值,当训练集数目<2500时,为低阈值;对于优先级为C的商品,当训练集数目≥5000时,为非常高阈值,当训练集数目≥2500时,为高阈值,当训练集数目≥1000时,为中等阈值,当训练集数目<1000时,为低阈值。非常高阈值对应置信度非常高、高阈值对应置信度高、中等阈值对应置信度中等、低阈值对应置信度低。置信度反映了该训练集的成熟度。
登记内容:
关于 浙江由由科技有限公司 , 浙江由由科技有限公司是一家专注于大数据处理、云计算服务的科技企业,致力于为各行业提供高效的数据解决方案和技术支持。该公司在数据处理和分析领域有着丰富的实践经验和技术积累。_simple
关于 浙江省数据知识产权登记平台 , 浙江省数据知识产权登记平台是一个专门用于登记和管理数据知识产权的官方平台。该平台允许企业和个人申请登记其数据知识产权,包括专利分类数据、客户价值评估数据等。平台提供公告功能,展示已登记、放弃或撤销的数据知识产权信息,并提供详细的申请人、申请时间和更新信息。





_1769672084863.jpg)