宾夕法尼亚大学 本次发布的数据集 UI-Bench, UI-Bench是一个用于评估AI文本到应用工具设计能力的大规模基准。它通过专家配对比较,对10种工具、30个提示、300个生成的站点和4000多个专家判断进行评估,以TrueSkill模型对系统进行排名,并提供校准置信区间。UI-Bench为推动基于AI的网页设计提供了一个可复制的标准。
关于 宾夕法尼亚大学 , 宾夕法尼亚大学是一所位于美国宾夕法尼亚州费城的世界著名私立研究型大学,创始于1740年,是美国第四古老的高等教育机构,也是美国东北部常春藤盟校之一。该校在多个学科领域均处于世界领先地位,尤其在商学、法学、医学、教育学等领域享有盛誉。_simple
关于 arXiv , arXiv 是一个免费分发服务和开放获取的学术文章档案库,涵盖了物理学、数学、计算机科学、定量生物学、定量金融、统计学、电气工程和系统科学以及经济学等领域。该网站上的材料并未经过 arXiv 的同行评审。





_1769672084863.jpg)