布加勒斯特大学 本次发布的数据集 OJI (Romanian County-Level Informatics Olympiad) 数据集, OJI数据集是由罗马尼亚县级信息学奥林匹克竞赛提供的技术问题集合,包含300条罗马尼亚语的计算问题。该数据集由布加勒斯特大学等研究机构创建,旨在通过增强的英语翻译来支持大语言模型的训练和评估。数据集的内容涵盖了8年级学生的低至中等难度问题,涉及字符串处理等复杂文本。数据集的创建过程包括从原始罗马尼亚语问题中选择44条进行翻译,并通过多次运行GPT-4o模型来评估翻译质量。该数据集的应用领域主要集中在自动翻译、教育材料生成以及多语言技术问题的解决,旨在减少翻译错误并提高大语言模型在非英语语言任务中的表现。
查看OJI (Romanian County-Level Informatics Olympiad) 数据集
关于 布加勒斯特大学 , 布加勒斯特大学是罗马尼亚最古老和最大的高等教育机构之一,成立于1864年。该大学提供广泛的学科课程,包括人文科学、社会科学、自然科学和工程学等,是罗马尼亚学术研究的重要中心。
关于 arXiv , arXiv 是一个免费分发服务和开放获取的学术文章档案库,涵盖了物理学、数学、计算机科学、定量生物学、定量金融、统计学、电气工程和系统科学以及经济学等领域。该网站上的材料并未经过 arXiv 的同行评审。





_1769672084863.jpg)