five
五号数据雷达
产品上架
产权登记
知识产权
公共数据
首页 / 开源数据市场 / 正文

雷根斯堡大学 发布 GTC (Genocide Transcript Corpus) 数据集, 应用在 种族灭绝研究、法庭转录分析 领域

五号数据雷达开源数据市场2024-10-13 00:0267
GTC (Genocide Transcript Corpus) 是 雷根斯堡大学 发布的数据集,于 2022-04-06 首发在 arXiv 应用于 种族灭绝研究、法庭转录分析 领域

雷根斯堡大学 本次发布的数据集 GTC (Genocide Transcript Corpus), GTC(种族灭绝转录语料库)是由雷根斯堡大学创建的第一个种族灭绝相关法庭转录的标注语料库。该数据集包含1475条文本片段,来源于柬埔寨特别法庭(ECCC)、卢旺达国际刑事法庭(ICTR)和前南斯拉夫国际刑事法庭(ICTY)。数据集的创建旨在为社区提供一个参考语料库,建立新的分类任务基准,并探索领域内的迁移学习。GTC特别关注于标注那些描述暴力经历的证人陈述,这些陈述对于判断案件至关重要。数据集的应用领域主要集中在种族灭绝研究,旨在通过自动化工具减少人工研究的工作量,提高搜索效率。

查看GTC (Genocide Transcript Corpus)

README 内容: 

 

关于 雷根斯堡大学 , 雷根斯堡大学(University of Regensburg)是德国的一所公立研究型大学,成立于1962年,位于巴伐利亚州的雷根斯堡市。该大学提供广泛的学科领域,包括人文科学、社会科学、自然科学和法律等。雷根斯堡大学以其高质量的研究和教学而闻名,特别是在法学、经济学和神学领域。

关于 arXiv , arXiv 是一个免费分发服务和开放获取的学术文章档案库,涵盖了物理学、数学、计算机科学、定量生物学、定量金融、统计学、电气工程和系统科学以及经济学等领域。该网站上的材料并未经过 arXiv 的同行评审。

数据合作广告位

社区讨论

近期热门
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

二维码
关注我们