香港中文大学 本次发布的数据集 ICM-Instruct, ICM-Instruct数据集是一个用于图像内容审核的大规模指令调优数据集,由香港中文大学、华为香港研究中心等机构联合创建。该数据集通过分解人类定义的规则,并利用多阶段提示生成详细的审核解释和问答对,涵盖了多种文化规范和儿童保护标准。数据集的内容包括丰富的图像注释、审核解释和问答对,旨在提升多模态大语言模型在图像内容审核中的分类和解释能力。数据集的创建过程涉及规则分解、图像下载和多阶段提示生成,最终应用于训练ICM-Assistant模型,显著提升了审核分类和解释的准确性。该数据集的应用领域主要是图像内容审核,旨在解决现有审核模型在分类和解释上与人类审核员不一致的问题,提供灵活、可解释且准确的审核结果。
README 内容:
关于 香港中文大学 , 香港中文大学是香港的一所公立研究型大学,成立于1963年,以其在人文、社会科学、商业和工程等领域的教学和研究而闻名。
关于 arXiv , arXiv 是一个免费分发服务和开放获取的学术文章档案库,涵盖了物理学、数学、计算机科学、定量生物学、定量金融、统计学、电气工程和系统科学以及经济学等领域。该网站上的材料并未经过 arXiv 的同行评审。





_1769672084863.jpg)