five
五号数据雷达
产品上架
产权登记
知识产权
公共数据
首页 / 开源数据市场 / 正文

中国科学院发布OmniBehavior数据集,应用在用户行为分析、大型语言模型评估领域

五号数据雷达开源数据市场2026-04-11 09:1828
OmniBehavior是中国科学院发布的数据集,于2026-04-09首发在arXiv应用于用户行为分析、大型语言模型评估领域

中国科学院本次发布的数据集OmniBehavior,OmniBehavior是由快手科技与中国科学院合作构建的首个基于真实用户行为数据的综合性基准测试集,旨在评估大型语言模型在长周期、跨场景和异质行为轨迹上的模拟能力。该数据集包含200名用户在三个月内的完整交互轨迹,覆盖视频浏览、直播、广告、电商和搜索五大场景,平均每条序列包含8,143个动作,总计22种异构行为类型。数据通过严格的匿名化、噪声过滤和聚类采样流程处理,保留了真实用户决策中的跨场景因果链和长尾分布特征,为社交科学、推荐系统和行为经济学等领域提供了高保真的研究基础。

查看OmniBehavior

关于中国科学院,中国科学院是中国自然科学最高学术机构、科学技术最高咨询机构、自然科学与高技术综合研究发展中心,成立于1949年11月。

关于arXiv,全球最大的预印本学术论文数据库,涵盖物理、数学、计算机科学等多个学科领域。

数据合作广告位

社区讨论

近期热门
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

二维码
关注我们