北京大学本次发布的数据集AesGuide,AesGuide是由北京大学团队构建的首个面向美学指导任务的大规模数据集,包含10,748张真实场景照片,每张均标注了美学评分、专业分析和拍摄改进建议。该数据集通过爬取网络平台照片与专业摄影师合作采购双重渠道构建,采用两阶段标注框架(MLLM初步提炼+专家人工修正)确保质量,重点解决现有模型在美学缺陷识别和可操作建议生成方面的不足。其核心应用领域为计算美学,旨在通过数据驱动方式提升多模态大模型在拍摄指导(如构图优化、光线调整)和后期裁剪中的解释性与交互能力。
关于北京大学,北京大学是中国著名的综合性研究型大学,创建于1898年,前身为京师大学堂。作为中国最高学府之一,北大在国内外享有极高声誉,涵盖文、理、医、工等多个学科领域。
关于arXiv,arXiv 是一个免费分发服务和开放获取的学术文章档案库,涵盖了物理学、数学、计算机科学、定量生物学、定量金融、统计学、电气工程和系统科学以及经济学等领域。该网站上的材料并未经过 arXiv 的同行评审。





_1769672084863.jpg)