本次发布的数据集 AmaSum, 该数据集名为AmaSum,主要基于专业评论员为消费品所撰写的总结,涵盖了四个主要的专业产品评论平台。该数据集包含了关于产品的结论性观点、优缺点,概括了产品最重要的信息。在数据集的创建过程中,使用了HTML抓取程序,并包含了经过验证和未经验证的亚马逊评论。为了提高数据质量,预处理过程中移除了短评和总结,使得该数据集在规模上显著大于现有的其他选择,覆盖了超过31,000种产品,平均每种产品拥有320条评论。该数据集的任务是对观点进行总结。
README 内容:
关于 , 国庆学校是一所位于中国的教育机构,专注于提供基础教育服务。学校致力于培养学生的综合素质,注重学术与品德的全面发展。
关于 arXiv , arXiv 是一个免费分发服务和开放获取的学术文章档案库,涵盖了物理学、数学、计算机科学、定量生物学、定量金融、统计学、电气工程和系统科学以及经济学等领域。该网站上的材料并未经过 arXiv 的同行评审。





_1769672084863.jpg)