Fondazione Bruno Kessler 本次发布的数据集 SHINES dataset (Self-Harm Identification aNd intent Extraction with Supportive emoji sensitivity), SHINES数据集是一个包含5206条手动标注的社交媒体帖子数据集,旨在用于自我伤害检测和意图提取。数据集包含了自我伤害标签、非正式提及(CMs)和严重意图(SIs)的详细注释,以及来自CESM-100的emoji解释。CESM-100是一个包含100个emoji的集合,每个emoji都有与自我伤害相关的上下文解释。数据集的创建过程包括数据收集、数据标注和增强数据集稳健性的合成帖子生成。数据集适用于自我伤害检测、情感分析、心理健康监测等领域,旨在解决自我伤害信号固有的歧义问题。
查看SHINES dataset (Self-Harm Identification aNd intent Extraction with Supportive emoji sensitivity)
关于 arXiv , arXiv 是一个免费分发服务和开放获取的学术文章档案库,涵盖了物理学、数学、计算机科学、定量生物学、定量金融、统计学、电气工程和系统科学以及经济学等领域。该网站上的材料并未经过 arXiv 的同行评审。





_1769672084863.jpg)