上海中医药大学 本次发布的数据集 TCM-Ladder, TCM-Ladder是一个大规模的多模态数据集,旨在为中医药领域的大型语言模型提供训练和评估。该数据集涵盖了中医药的多个子学科,包括基本理论、诊断、药方、药理学等,并融合了文本、图像、音频和视频等多种数据类型。数据集的建设过程中,收集了超过52,000个问题,包括单选题、多选题、填空题、诊断对话和视觉理解任务等。所有文本和视觉数据均由认证的中医药从业者独立审查和验证,以确保准确性和临床相关性。
关于 arXiv , arXiv 是一个免费分发服务和开放获取的学术文章档案库,涵盖了物理学、数学、计算机科学、定量生物学、定量金融、统计学、电气工程和系统科学以及经济学等领域。该网站上的材料并未经过 arXiv 的同行评审。





_1769672084863.jpg)