Flower Labs 本次发布的数据集 FlowerTune, FlowerTune 是一个跨领域的联邦微调大型语言模型(LLM)基准测试套件,旨在评估在四个不同领域(通用 NLP、金融、医疗和编码)中进行联邦微调的 LLM 的性能。数据集由 Flower Labs 和其他研究机构创建,包括来自各个领域的联邦指令微调数据集和特定领域的评估指标。FlowerTune 通过开源和社区驱动的协作方式,提供了对 26 个预训练 LLM 在联邦设置下不同聚合和微调策略下的全面比较,为开发隐私保护、领域专业的 LLM 提供了基础。
README 内容:
关于 arXiv , arXiv 是一个免费分发服务和开放获取的学术文章档案库,涵盖了物理学、数学、计算机科学、定量生物学、定量金融、统计学、电气工程和系统科学以及经济学等领域。该网站上的材料并未经过 arXiv 的同行评审。





_1769672084863.jpg)