PRISM - 人类反馈多元文化对齐数据集|AI语言模型数据集|多元文化对齐数据集

PRISM - 人类反馈多元文化对齐数据集

github2024-04-24 更新2024-06-19 收录6850

AI语言模型

多元文化对齐

资源简介：

PRISM数据集由牛津大学、宾夕法尼亚大学、MeatAI等机构联合构建，是一个开创性的多语言反馈数据集，旨在深入探索和理解大型语言模型（LLMs）的主观和多元文化对齐问题。该数据集包含了来自75个国家的1500名不同参与者的背景信息、偏好声明，以及他们在与21个LLMs进行的8011次实时对话的反馈。PRISM数据集以其广泛的地理和人口统计参与度，为AI发展中的人类反馈数据提供了新的视角，它不仅包含两个具有代表性的样本（英国和美国），以理解集体福祉，还通过将每个评分链接到详细的参与者档案，允许研究个性化和样本偏差。此外，PRISM强调了在价值负载和有争议的话题上的对话多样性、偏好多样性以及福利结果，展示了人类在设定对齐规范时的重要性。该数据集旨在通过这些详细的数据，探索和理解人们对于AI语言模型行为的偏好和期望，以及如何在设计和开发中实现更广泛的参与和代表性。

原始地址：

立即探测

提供机构：

牛津大学、宾夕法尼亚大学、MeatAI等

创建时间：

2024-04-24