香港大学 本次发布的数据集 AGENTNET, OPENCUA是一个全面的开放源代码框架,用于扩展计算机使用代理(CUA)数据和基础模型。该框架包括:(1)一个无缝捕捉人类计算机使用演示的注释基础设施;(2)AGENTNET,这是第一个涵盖3个操作系统和200多个应用程序和网站的大型计算机使用任务数据集;(3)一个可扩展的管道,它将演示转换为具有反思性长链式思维推理的状态-动作对,这种推理可以随着数据规模的扩大而保持稳健的性能提升。我们的端到端代理模型在CUA基准测试中表现出色。特别是,OPENCUA-32B在OSWorld-Verified上实现了34.8%的平均成功率,在开源模型中建立了新的最先进水平,并超过了OpenAI CUA(基于GPT-4o)。进一步的分析证实,我们的方法在不同领域具有很好的泛化能力,并且从增加的测试时间计算中受益匪浅。我们发布我们的注释工具、数据集、代码和模型,为CUA研究的进一步发展建立开放的基石。
Dataset card 内容:
Files and versions 内容:
关于 香港大学 , 香港大学是一所位於中国香港的国际化公立研究型大学,是香港最历史悠久的高等教育机构之一,提供多个学科领域的本科及研究生课程,并在全球享有高度声誉。
关于 arXiv , arXiv 是一个免费分发服务和开放获取的学术文章档案库,涵盖了物理学、数学、计算机科学、定量生物学、定量金融、统计学、电气工程和系统科学以及经济学等领域。该网站上的材料并未经过 arXiv 的同行评审。





_1769672084863.jpg)