中国科学院本次发布的数据集OmniBehavior,OmniBehavior是由快手科技与中国科学院合作构建的首个基于真实用户行为数据的综合性基准测试集,旨在评估大型语言模型在长周期、跨场景和异质行为轨迹上的模拟能力。该数据集包含200名用户在三个月内的完整交互轨迹,覆盖视频浏览、直播、广告、电商和搜索五大场景,平均每条序列包含8,143个动作,总计22种异构行为类型。数据通过严格的匿名化、噪声过滤和聚类采样流程处理,保留了真实用户决策中的跨场景因果链和长尾分布特征,为社交科学、推荐系统和行为经济学等领域提供了高保真的研究基础。
关于中国科学院,中国科学院是中国自然科学最高学术机构、科学技术最高咨询机构、自然科学与高技术综合研究发展中心,成立于1949年11月。
关于arXiv,全球最大的预印本学术论文数据库,涵盖物理、数学、计算机科学等多个学科领域。





_1769672084863.jpg)