宾夕法尼亚大学 本次发布的数据集 UI-Bench, UI-Bench是一个用于评估AI文本到应用工具设计能力的大规模基准。它通过专家配对比较,对10种工具、30个提示、300个生成的站点和4000多个专家判断进行评估,以TrueSkill模型对系统进行排名,并提供校准置信区间。UI-Bench为推动基于AI的网页设计提供了一个可复制的标准。
关于 宾夕法尼亚大学 , 宾夕法尼亚大学是一所位于美国宾夕法尼亚州费城的世界著名私立研究型大学,是美国历史上第一所现代意义上的大学,也是常春藤联盟成员之一,以其卓越的学术研究和教育质量享誉全球。_simple
关于 arXiv , arXiv 是一个免费分发服务和开放获取的学术文章档案库,涵盖了物理学、数学、计算机科学、定量生物学、定量金融、统计学、电气工程和系统科学以及经济学等领域。该网站上的材料并未经过 arXiv 的同行评审。





_1769672084863.jpg)