北京交通大学 本次发布的数据集 Railway Training Dataset (RTD), Railway Training Dataset (RTD)是由北京交通大学自动化与智能学院构建的铁路领域特定微调数据集,包含10100条结构化问答对,涵盖铁路法律条款、铁路规章和铁路专业知识。数据集基于中国铁路机车和车辆驾驶员资格考试大纲构建,原始文本数据包含776,000个中文Token,分为法律条款、铁路规章和铁路专业知识三大类。该数据集旨在提升大语言模型在铁路领域的专业知识,特别是在故障处理场景中的应用。通过自动化处理策略生成问答对,并经过严格的数据过滤,最终用于铁路驾驶场景的对话支持。
查看Railway Training Dataset (RTD)
关于 北京交通大学 , 北京交通大学是中国一所著名的综合性大学,位于北京市。该校历史悠久,以工程、管理和信息技术等学科著称,是中国重点支持的高等学府之一。
关于 arXiv , arXiv 是一个免费分发服务和开放获取的学术文章档案库,涵盖了物理学、数学、计算机科学、定量生物学、定量金融、统计学、电气工程和系统科学以及经济学等领域。该网站上的材料并未经过 arXiv 的同行评审。




_1769672084863.jpg)