新加坡管理大学 本次发布的数据集 conversational preference dataset, 该数据集由新加坡管理大学和新加坡国立大学的研究团队创建,旨在通过对话偏好数据对齐大语言模型,确保其在面对对立论点时保持忠实完整性。数据集包含上下文、原始陈述和论点,用于直接偏好优化(DPO)训练。数据集的内容主要来源于对话场景,通过双边置信度估计(BCE)方法生成。该数据集的应用领域为自然语言处理,旨在解决大语言模型在对话中容易被对立论点误导的问题,提升模型的可靠性和一致性。
查看conversational preference dataset
关于 新加坡管理大学 , 新加坡管理大学(Singapore Management University, SMU)是新加坡的一所公立大学,成立于2000年。该校以商科、社会科学和信息技术等领域的教学和研究著称,采用美国式的教育模式,强调互动式教学和实际应用。SMU位于新加坡市中心,拥有现代化的校园设施和国际化师资力量。
关于 arXiv , arXiv 是一个免费分发服务和开放获取的学术文章档案库,涵盖了物理学、数学、计算机科学、定量生物学、定量金融、统计学、电气工程和系统科学以及经济学等领域。该网站上的材料并未经过 arXiv 的同行评审。





_1769672084863.jpg)