five
五号数据雷达
产品上架
产权登记
知识产权
公共数据
首页 / 开源数据市场 / 正文

【五号雷达-数据快讯】CaLM Dataset - 多样化的因果评测数据集

五号雷达开源数据市场2024-05-15 15:1879
该数据集约90%的内容为全新构建,10%来自于现有公开数据集,既能与已有公开结果进行对比,反映评估的有效性,又能避免训练集数据污染问题。

CaLM Dataset是上海人工智能实验室、同济大学、上海交通大学、北京大学及商汤科技联合构建的一套全新的评测数据集,旨在使因果推理能力评估有“考题”可循。该数据集包含超过12万条中英文数据,基于四个层级的因果任务设置,涵盖了丰富的因果概念。同时,研究人员还细致地将文本模态划分为日常表达(Natural)、抽象表达(Symbolic)和数学表达(Mathematical)三种子态,以考察模型在不同类型模态下的理解能力。该数据集约90%的内容为全新构建,10%来自于现有公开数据集,既能与已有公开结果进行对比,反映评估的有效性,又能避免训练集数据污染问题。

详情请参见五号雷达:https://www.5radar.com/result?key=CaLM+Dataset

数据合作广告位

社区讨论

近期热门
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

二维码
关注我们