香港理工大学 本次发布的数据集 RSD-15K, RSD-15K是一个大规模的用户级注释数据集,用于社交媒体上的自杀风险检测。该数据集包含约15,000条用户级帖子,是目前同类数据集中最大的之一。我们不仅保留了用户的完整发帖时间序列信息,以支持风险演变分析,还采用了一个四级风险等级注释系统,显著提高了风险评估的精度。在数据注释过程中,我们在专业指导下进行了多轮交叉验证,以确保注释结果的可靠性和一致性。该数据集在提出请求后公开可用。在基准测试中,我们使用从传统机器学习到深度学习的多个基线模型对系统进行了评估。实验结果表明,所有类型的模型在用户级风险识别任务中都能实现可靠的性能,这强烈证实了数据集的质量和实用价值。特别是在时间序列特征建模方面,我们的数据集显示出独特的优势。
关于 arXiv , arXiv 是一个免费分发服务和开放获取的学术文章档案库,涵盖了物理学、数学、计算机科学、定量生物学、定量金融、统计学、电气工程和系统科学以及经济学等领域。该网站上的材料并未经过 arXiv 的同行评审。





_1769672084863.jpg)