five
五号数据雷达
产品上架
产权登记
知识产权
公共数据
首页 / 开源数据市场 / 正文

德国人工智能研究中心 (DFKI) 发布 TUB Sign Language Corpus Collection 数据集, 应用在 手语识别、自然语言处理 领域

五号数据雷达开源数据市场2025-08-09 07:2350
TUB Sign Language Corpus Collection 是 德国人工智能研究中心 (DFKI) 发布的数据集,于 2025-08-07 首发在 arXiv 应用于 手语识别、自然语言处理 领域

德国人工智能研究中心 (DFKI) 本次发布的数据集 TUB Sign Language Corpus Collection, TUB手语语料库集合是一个包含12种手语视频和相应国家主要语言的字幕的平行语料库集合。整个集合包含超过1300小时的4381个视频文件,配有130万个字幕,包含1400万个词元。这个集合由来自各种在线来源的多个手语视频收集和加工而成,主要来自新闻节目、政府机构和教育频道的广播材料。该集合的创建过程包括数据收集、通知内容创作者并寻求使用许可、抓取和裁剪等多个阶段。该集合旨在解决手语技术研究中数据集缺乏的问题,为提高手语的可访问性和降低交流障碍提供支持。

查看TUB Sign Language Corpus Collection

关于 德国人工智能研究中心 (DFKI) , 德国人工智能研究中心(Deutsches Forschungszentrum für Künstliche Intelligenz, DFKI)是德国领先的人工智能研究机构,致力于在人工智能领域进行基础和应用研究,并在智能系统的开发和应用方面与工业界合作紧密。

关于 arXiv , arXiv 是一个免费分发服务和开放获取的学术文章档案库,涵盖了物理学、数学、计算机科学、定量生物学、定量金融、统计学、电气工程和系统科学以及经济学等领域。该网站上的材料并未经过 arXiv 的同行评审。

数据合作广告位

社区讨论

近期热门
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

二维码
关注我们