five
五号数据雷达
产品上架
产权登记
知识产权
公共数据
首页 / 数据知识产权登记 / 正文

大规模、多模态、多任务的天基遥感大模型指令微调数据已成功在浙江省数据知识产权登记平台进行登记,应用在遥感技术、数据标注领域

五号数据雷达数据知识产权登记2025-04-11 02:2917
2025-04-10 , 之江实验室 旗下 大规模、多模态、多任务的天基遥感大模型指令微调数据 数据知识产权在 浙江省数据知识产权登记平台 完成登记 , 应用于 遥感技术、数据标注 领域

之江实验室 本次登记的数据知识产权 大规模、多模态、多任务的天基遥感大模型指令微调数据, 该数据知识产权数据的总数大于7000万条,能够直接用于天基多模态遥感大模型训练,使其具备图像、区域和像素3个层级、14种细分遥感视觉任务的统一处理能力。打造基于视觉-语言架构的高鲁棒、高性能的星上遥感大模型,通过简单自然语言指令即可实现复杂的遥感任务即时处理。依托“三体计算星座”,在轨部署该天基遥感大模型,大大简化星上任务处理流程,提升在轨处理精度。该模型可应用于全球对地观测,例如地表异常灾害监测,重点海域船舶流量统计等。1. 从互联网数据开放管理平台广泛收集遥感领域的原始数据集。 2. 对影像中带有的数据源标识、采样时间等进行过滤脱敏处理。 3. 人工+算法审查数据,对不符合要求、质量过低的原始数据进行剔除处理。 4. 设计新的标注体系与标准化转换算法,对原始数据集中不同任务、不同格式的标注文件转化为统一格式的标准化标注。 5. 对图像尺寸进行标准化,并设计标注修复算法,对图像裁剪后导致的标注截断问题进行修复。 6. 提出基于大模型的对话生成算法并制定对话模板,对全量数据进行处理,构建指令微调数据集。其中,每条数据包含图像地址、问题指令以及问题答案,总量大于7000万条。 7. 使用产出的指令微调数据集进行模型训练。模型基于视觉-语言模型架构,实现14种多模态遥感任务的统一处理。其中,图像级任务包含分类(IMG_CLS)、简短描述(IMG_CAP)、详细描述([IMG_CAP_DETAILED])、计数([IMG_CT])、视觉问答([IMG_VQA]);区域级任务包含水平框分类([REG_CLS_HBB])、旋转框分类([REG_CLS_OBB])、区域级描述([REG_CAP])、水平框检测([REG_DET_HBB])、旋转框检测([REG_DET_OBB])、视觉定位([REG_VG]);像素级任务包含像素级分类([PIX_CLS])、分割([PIX_SEG])、变化检测([PIX_CHG])

查看大规模、多模态、多任务的天基遥感大模型指令微调数据

登记内容:

 

关于 之江实验室 , 之江实验室是由浙江省人民政府、浙江大学、阿里巴巴集团共同举办的新型研发机构,致力于前沿技术研究和产业孵化。实验室围绕智能感知、云计算、大数据等领域开展创新工作,已取得一系列重要科研成果。

关于 浙江省数据知识产权登记平台 , 浙江省数据知识产权登记平台是浙江省市场监督管理局(省知识产权局)联合多个部门开发建设的数字化应用,属于‘浙江知识产权在线’的应用场景之一。该平台旨在提供数据知识产权登记公共服务,通过区块链存证或数据保全公证,对数据知识产权进行登记,颁发登记证书,用于数据流通交易、收益分配和权益保护。

数据合作广告位

社区讨论

近期热门
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

二维码
关注我们