Chandar Lab 本次发布的数据集 Pre-trained agents for Hanabi, 该数据集包含了一系列经过预训练的智能体,包括自我对弈智能体和针对零样本协同(ZSC)进行训练的智能体,其目的是为了评估多智能体强化学习(MARL)方法的适应性。数据集涵盖了多种算法,如IQL、VDN、OBL等,并记录了它们在多次适应性试验中的性能指标。该任务旨在合作多智能体环境中对适应性进行评估。
查看Pre-trained agents for Hanabi
关于 arXiv , arXiv 是一个免费分发服务和开放获取的学术文章档案库,涵盖了物理学、数学、计算机科学、定量生物学、定量金融、统计学、电气工程和系统科学以及经济学等领域。该网站上的材料并未经过 arXiv 的同行评审。





_1769672084863.jpg)