SemEval-2020 Task Organisers 本次发布的数据集 SemEval-2020 Task 5 Dataset, 该数据集包含了一种称为反事实的文本表达,这些表达描述了未曾发生或可能不会发生的事件。数据集在子任务1上的负样本与正样本的比例高达88:12,为了解决这一高度不平衡的问题,研究尝试了多种方法,包括过采样、SMOTE算法、欠采样以及加权交叉熵损失。具体规模上,子任务1拥有13,000个示例,子任务2有3,500个示例;而在测试集方面,子任务1有7,000个句子,子任务2有1,950个句子。该数据集的任务是检测反事实陈述,并将其解析为前提和结果。
README 内容:
关于 SemEval-2020 Task Organisers , -
关于 arXiv , arXiv 是一个免费分发服务和开放获取的学术文章档案库,涵盖了物理学、数学、计算机科学、定量生物学、定量金融、统计学、电气工程和系统科学以及经济学等领域。该网站上的材料并未经过 arXiv 的同行评审。





_1769672084863.jpg)