five
五号数据雷达
产品上架
产权登记
知识产权
公共数据
首页 / 数据知识产权登记 / 正文

人工智能多语言多模态数据集已成功在北京市数据知识产权进行登记,应用在多模态学习、人工智能领域

五号数据雷达数据知识产权登记2024-10-13 15:1923
2024-01-05 , 数据堂(北京)科技股份有限公司 旗下 人工智能多语言多模态数据集 数据知识产权在 北京市数据知识产权 完成登记 , 应用于 多模态学习、人工智能 领域

数据堂(北京)科技股份有限公司 本次登记的数据知识产权 人工智能多语言多模态数据集, 本数据集可用于多语言多模态大模型和数字人领域算法训练,具体介绍如下。 在大模型领域,大语言模型提供了文本理解能力,在此基础上,各大人工智能企业正构建多模态大模型算法能力,多模态大模型主要功能包括文本生成图像、图像描述、文本生成视频、视频描述等,上述任务需要高质量的图像-文本及视频-文本对数据集,本数据集包含多种场景、多种描述、多种语言的图像-文本对和视频-文本对数据集,可在上述任务中对基础多模态大模型和行业多模态大模型提供算法训练及测试支持。 在数字人领域,人工智能企业正研发多种场景数字人合成技术,包括但不限于动画、游戏、主播、客服、陪伴机器人等。数字人合成算法需要大量高质量的同时带有文本、语音、图像、视频的多模态数据集。本数据集包括不同人种、不同风格、不同年龄、不同情绪、不同场景的多模态数据,数据包含语音、文本、图像、视频模态,可为上述各场景数字人合成算法训练及测试提供支持。

查看人工智能多语言多模态数据集

登记内容:

 

关于 数据堂(北京)科技股份有限公司 , 数据堂(北京)科技股份有限公司是一家专注于技术开发、技术服务以及数据处理的公司,其业务还涵盖基础与应用软件服务、市场调查、货物与技术进出口、以及人工智能系统服务等。该公司在数据领域拥有显著实力,其数据集资源覆盖多个领域,包括但不仅限于文本、语音、图像等。其数据集特点为多样性和专业性,例如,拥有大模型内容安全文本数据集、多模态大模型视频-文本数据集等,体现了公司在多模态数据处理方面的能力。此外,数据堂还在人工智能多语言处理方面有着丰富的数据集资源,如多语言平行语料文本数据集、多语言自然对话语音数据集等,显示了其在语言处理领域的深厚积累。

关于 北京市数据知识产权 , 北京市数据知识产权是一个提供数据交易、数据服务和数据应用解决方案的平台,旨在促进政府、企业和社会公众之间的数据资源整合与利用。

数据合作广告位

社区讨论

近期热门
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

二维码
关注我们