five
五号数据雷达
产品上架
产权登记
知识产权
公共数据
首页 / 开源数据市场 / 正文

【五号雷达-数据快讯】OpenToM - 心智理论评估数据集

五号雷达开源数据市场2024-03-01 15:2455
OpenToM数据集为心智研究提供了可靠的评估基准,对心智模型的开发与优化具有重要意义。

OpenToM是伦敦国王学院和华为伦敦研究中心等提出的一个评估大模型心智理论的新基准。其特点包括:长且清晰的叙事、性格鲜明的角色、基于角色意图的行动,以及旨在挑战大语言模型在模拟角色心理状态方面能力的问题。该基准库包含696个叙述,其中596个为标准长度(平均194.3个单词),100个为长篇(平均491.6个单词),每个叙述后附有23个心智问题,总计16008个。OpenToM数据集为心智研究提供了可靠的评估基准,对心智模型的开发与优化具有重要意义。

数据集地址:
https://github.com/seacowx/OpenToM
https://huggingface.co/datasets/SeacowX/OpenToM
数据合作广告位

社区讨论

近期热门
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

二维码
关注我们