首页 / 开源数据市场 / 正文

德国人工智能研究中心 (DFKI) 发布 TUB Sign Language Corpus Collection 数据集, 应用在手语识别、自然语言处理领域

五号数据雷达开源数据市场2025-08-09 07:2350

TUB Sign Language Corpus Collection 是德国人工智能研究中心 (DFKI) 发布的数据集,于 2025-08-07 首发在 arXiv 应用于手语识别、自然语言处理领域

德国人工智能研究中心 (DFKI) 本次发布的数据集 TUB Sign Language Corpus Collection, TUB手语语料库集合是一个包含12种手语视频和相应国家主要语言的字幕的平行语料库集合。整个集合包含超过1300小时的4381个视频文件，配有130万个字幕，包含1400万个词元。这个集合由来自各种在线来源的多个手语视频收集和加工而成，主要来自新闻节目、政府机构和教育频道的广播材料。该集合的创建过程包括数据收集、通知内容创作者并寻求使用许可、抓取和裁剪等多个阶段。该集合旨在解决手语技术研究中数据集缺乏的问题，为提高手语的可访问性和降低交流障碍提供支持。

查看TUB Sign Language Corpus Collection

关于德国人工智能研究中心 (DFKI) , 德国人工智能研究中心（Deutsches Forschungszentrum für Künstliche Intelligenz, DFKI）是德国领先的人工智能研究机构，致力于在人工智能领域进行基础和应用研究，并在智能系统的开发和应用方面与工业界合作紧密。

关于 arXiv , arXiv 是一个免费分发服务和开放获取的学术文章档案库，涵盖了物理学、数学、计算机科学、定量生物学、定量金融、统计学、电气工程和系统科学以及经济学等领域。该网站上的材料并未经过 arXiv 的同行评审。

社区讨论

近期热门

德国人工智能研究中心 (DFKI) 发布 TUB Sign Language Corpus Collection 数据集, 应用在 手语识别、自然语言处理 领域

社区讨论

德国人工智能研究中心 (DFKI) 发布 TUB Sign Language Corpus Collection 数据集, 应用在手语识别、自然语言处理领域