five
五号数据雷达
产品上架
产权登记
知识产权
公共数据
首页 / 开源数据市场 / 正文

香港中文大学 发布 ICM-Instruct 数据集, 应用在 图像内容审核、多模态学习 领域

五号数据雷达开源数据市场2024-12-26 08:1667
ICM-Instruct 是 香港中文大学 发布的数据集,于 2024-12-24 首发在 arXiv 应用于 图像内容审核、多模态学习 领域

香港中文大学 本次发布的数据集 ICM-Instruct, ICM-Instruct数据集是一个用于图像内容审核的大规模指令调优数据集,由香港中文大学、华为香港研究中心等机构联合创建。该数据集通过分解人类定义的规则,并利用多阶段提示生成详细的审核解释和问答对,涵盖了多种文化规范和儿童保护标准。数据集的内容包括丰富的图像注释、审核解释和问答对,旨在提升多模态大语言模型在图像内容审核中的分类和解释能力。数据集的创建过程涉及规则分解、图像下载和多阶段提示生成,最终应用于训练ICM-Assistant模型,显著提升了审核分类和解释的准确性。该数据集的应用领域主要是图像内容审核,旨在解决现有审核模型在分类和解释上与人类审核员不一致的问题,提供灵活、可解释且准确的审核结果。

查看ICM-Instruct

README 内容: 

 

关于 香港中文大学 , 香港中文大学是香港的一所公立研究型大学,成立于1963年,以其在人文、社会科学、商业和工程等领域的教学和研究而闻名。

关于 arXiv , arXiv 是一个免费分发服务和开放获取的学术文章档案库,涵盖了物理学、数学、计算机科学、定量生物学、定量金融、统计学、电气工程和系统科学以及经济学等领域。该网站上的材料并未经过 arXiv 的同行评审。

数据合作广告位

社区讨论

近期热门
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

二维码
关注我们