中国科学院计算技术研究所 本次发布的数据集 人机混合新闻推荐数据集, 该数据集由中国科学院计算技术研究所媒体合成与取证实验室构建,包含约75,000篇新闻文章,旨在研究大型语言模型生成的假新闻对新闻生态系统的影响。数据集包含新闻条目、真实性标签和用户-新闻交互记录,用于模拟和评估假新闻在新闻推荐系统中的影响。数据集的构建过程包括重新利用现有的假新闻检测数据集、利用LLM生成新闻数据并进行质量检查。数据集的创建为研究假新闻在新闻推荐系统中的传播和影响提供了宝贵资源,有助于提高新闻生态系统的完整性和可信度。
关于 中国科学院计算技术研究所 , 中国科学院计算技术研究所是中国科学院下属的研究机构,专注于计算机科学与技术领域的研究。
关于 arXiv , arXiv 是一个免费分发服务和开放获取的学术文章档案库,涵盖了物理学、数学、计算机科学、定量生物学、定量金融、统计学、电气工程和系统科学以及经济学等领域。该网站上的材料并未经过 arXiv 的同行评审。





_1769672084863.jpg)