five

五号数据雷达

资产融资
资源入表
产品交易
知识产权
首页 / 开源数据市场 / 正文
北京交通大学 发布 Railway Training Dataset (RTD) 数据集, 应用在 铁路、自然语言处理 领域
五号数据雷达开源数据市场2025-01-16 12:20105
Railway Training Dataset (RTD) 是 北京交通大学 发布的数据集,于 2025-01-14 首发在 arXiv 应用于 铁路、自然语言处理 领域

北京交通大学 本次发布的数据集 Railway Training Dataset (RTD), Railway Training Dataset (RTD)是由北京交通大学自动化与智能学院构建的铁路领域特定微调数据集,包含10100条结构化问答对,涵盖铁路法律条款、铁路规章和铁路专业知识。数据集基于中国铁路机车和车辆驾驶员资格考试大纲构建,原始文本数据包含776,000个中文Token,分为法律条款、铁路规章和铁路专业知识三大类。该数据集旨在提升大语言模型在铁路领域的专业知识,特别是在故障处理场景中的应用。通过自动化处理策略生成问答对,并经过严格的数据过滤,最终用于铁路驾驶场景的对话支持。

查看Railway Training Dataset (RTD)

关于 北京交通大学 , 北京交通大学是中国一所著名的综合性大学,位于北京市。该校历史悠久,以工程、管理和信息技术等学科著称,是中国重点支持的高等学府之一。

关于 arXiv , arXiv 是一个免费分发服务和开放获取的学术文章档案库,涵盖了物理学、数学、计算机科学、定量生物学、定量金融、统计学、电气工程和系统科学以及经济学等领域。该网站上的材料并未经过 arXiv 的同行评审。

近期热门
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

二维码
关注我们