亚马逊 本次发布的数据集 PersonaLens, PersonaLens是一个用于评估面向任务的AI助手个性化能力的全面基准数据集。该数据集由亚马逊的研究团队创建,包含1500个用户配置文件、111个任务以及两个基于LLM的代理:一个模拟真实用户与AI助手进行任务导向对话的用户代理,以及一个基于LLM-as-a-Judge范式评估个性化的法官代理。数据集涵盖了丰富的用户偏好和交互历史,为个性化评估提供了深入的上下文信息。
README 内容:
关于 亚马逊 , 亚马逊是全球最大的电子商务和云计算公司之一,由杰夫·贝索斯于1994年创立。公司业务涵盖在线零售、云计算服务(AWS)、数字流媒体等多个领域,是全球科技行业的领军企业之一。
关于 arXiv , arXiv 是一个免费分发服务和开放获取的学术文章档案库,涵盖了物理学、数学、计算机科学、定量生物学、定量金融、统计学、电气工程和系统科学以及经济学等领域。该网站上的材料并未经过 arXiv 的同行评审。





_1769672084863.jpg)