北京大学本次登记的数据知识产权基于社会主义核心价值观的文本价值认证高质量数据集,1、应用范围: (1)训练以社会主义核心价值观为依据,对随机给定文本内容进行价值识别与认证的专用算法模型; (2)生成式人工智能的价值对齐训练,增强模型在内容生成与理解过程中的价值判断能力。 2、应用对象:党政部门、主流媒体、商业平台、科研院所等。 3、所能解决的主要问题: (1)解决信息内容平台在“内容审核”与“内容推荐”算法训练中缺乏专业标注样本的问题。本数据集为训练价值识别与认证算法提供了充足样本,可以解决目前信息内容平台因缺乏关于“正面”的标准,进而导致无法基于社会主义核心价值观,从海量UGC与PGC中精准识别优质内容并进行推荐分发的难题。 (2)解决生成式人工智能模型在“价值观对齐”训练中缺乏高质量语料的问题。本数据集提供了基于社会主义核心价值观的结构化语料,能够作为RLHF的关键训练集,可以有效增强生成式人工智能模型在内容生成与理解过程中的价值判断能力。化解意识形态安全风险。 (3)解决监管部门在评估网络空间生态时缺乏可量化指标的问题。本数据集为对平台网站(包括其中个人与机构账户)的信息内容生态进行测量提供了可量化的“参照物”,可以有效提升绩效评估的时效性、客观性与科学性。
登记内容:
关于北京大学,北京大学是中国著名的高等教育机构,主要负责培养高等学历人才,致力于促进科技文化的发展。学校提供多层次的学历教育,包括医学、教育学、哲学、经济学、法学、文学、历史学、理学、工学、管理学等各类学科的专科、本科、硕士和博士研究生学历教育,同时还进行博士后培养。在数据资源方面,北京大学拥有丰富多样的数据集,这些数据集涵盖了各个学科的广泛领域,虽然具体数据集特点各异,但都体现了北大学术研究的深度和广度。通过这些数据集,可以一窥北大在科研和教育方面的实力与成果。
关于北京市数据知识产权,北京市数据知识产权是指在北京市范围内,对经过一定算法加工、具有实用价值且未公开的数据集合所形成的智力成果所享有的数据权益,并通过北京市知识产权局等多部门联合发布的相关管理办法和登记平台进行保护和管理的一种新型知识产权。





_1769672084863.jpg)