芬兰图尔库大学 本次发布的数据集 OASST2和HelpSteer2, OASST2是一个经过精心挑选的英语对话数据集,包含顶级对话内容。HelpSteer2是一个包含公开来源提示和LLM生成完成的偏置数据集。这些数据集被翻译成芬兰语以进行指令遵循和偏好优化训练。作者使用这些数据集对多语言LLM进行微调,并在Finnish LLM开发中做出了贡献,通过开放许可发布了数据集、配方和模型。
Dataset card 内容:
Files and versions 内容:
关于 芬兰图尔库大学 , 芬兰图尔库大学是位于芬兰西南部图尔库市的一所综合性大学,是芬兰最大的大学之一,提供广泛的学术课程和研究项目。TurkuNLP可能是该校的一个研究小组或实验室,专注于自然语言处理领域的研究。
关于 arXiv , arXiv 是一个免费分发服务和开放获取的学术文章档案库,涵盖了物理学、数学、计算机科学、定量生物学、定量金融、统计学、电气工程和系统科学以及经济学等领域。该网站上的材料并未经过 arXiv 的同行评审。





_1769672084863.jpg)