巴塞罗那超级计算中心(BSC-CNS) 本次发布的数据集 Aloe Beta, Aloe Beta数据集是巴塞罗那超级计算中心(BSC-CNS)和加泰罗尼亚理工大学(UPC)联合开发的医疗领域大型语言模型(LLM)训练数据集。该数据集包含1.2M条医学数据指令和420K条通过LLM生成的医学数据指令,旨在提高模型在医疗领域的专业知识和响应用户指令的能力。数据集由高质量的医学数据集和通过LLM生成的合成数据组成,旨在解决医疗领域LLM开发中的数据不足问题,并提高模型的安全性和可靠性。
Dataset card 内容:
Files and versions 内容:
关于 巴塞罗那超级计算中心(BSC-CNS) , 巴塞罗那超级计算中心(BSC-CNS)是西班牙领先的超级计算中心,致力于科学研究和技术发展,特别是在高性能计算领域。
关于 arXiv , arXiv 是一个免费分发服务和开放获取的学术文章档案库,涵盖了物理学、数学、计算机科学、定量生物学、定量金融、统计学、电气工程和系统科学以及经济学等领域。该网站上的材料并未经过 arXiv 的同行评审。





_1769672084863.jpg)