five
五号数据雷达
产品上架
产权登记
知识产权
公共数据
首页 / 开源数据市场 / 正文

克拉科夫AGH大学发布Targum数据集,应用在多语言翻译、数字人文领域

五号数据雷达开源数据市场2026-03-18 03:2429
Targum是克拉科夫AGH大学发布的数据集,于2026-03-17首发在arXiv应用于多语言翻译、数字人文领域

克拉科夫AGH大学本次发布的数据集Targum,Targum是由克拉科夫AGH大学创建的多语言新约翻译语料库,包含651个翻译版本(334个唯一版本),涵盖英语、法语等五种语言,数据量达2.4–5.0倍于先前资源。该数据集聚合自12个在线圣经图书馆和现有语料库,每个翻译均标注了作品标识、版本和修订年份等元数据。通过标准化处理,支持研究者进行翻译家族微观分析或宏观去重研究。该语料库填补了翻译史定量研究的空白,适用于数字人文、翻译学和历时语言分析等领域。

查看Targum

README内容:

 

关于克拉科夫AGH大学,克拉科夫AGH大学位于波兰克拉科夫市,是一所著名的技术大学,成立于1853年,以其在矿业、冶金和地质学等领域的研究和教育闻名。

关于arXiv,全球最大的预印本学术论文数据库,涵盖物理、数学、计算机科学等多个学科领域。

数据合作广告位

社区讨论

近期热门
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

二维码
关注我们