five
五号数据雷达
产品上架
产权登记
知识产权
公共数据
首页 / 开源数据市场 / 正文

【五号雷达-数据快讯】EgoThink - 第一人称视角下视觉问答基准数据集

五号雷达开源数据市场2024-03-31 10:4678
EgoThink的应用领域广泛,特别是在评估和提升VLMs在第一人称视角任务中的性能,为未来的具身人工智能和机器人研究提供了宝贵的资源。

EgoThink是清华大学提出的一个以第一人称为视角的视觉问答基准数据集。该数据集由700张图像组成,覆盖6个核心能力,并细分为12个维度。EgoThink来源于Ego4D第一人称视频数据集的采样图片,为保证数据多样性,每条视频最多只采样出两张图片。数据集图片同样经过了严格的筛选,只留下了拥有较好质量和能明显体现第一人称视角思考的图片。数据集采用人工标注,每个维度至少包含50条详细标注的问答问题,并来源于多个第一视角的现实场景。EgoThink的应用领域广泛,特别是在评估和提升VLMs在第一人称视角任务中的性能,为未来的具身人工智能和机器人研究提供了宝贵的资源。

详情请参见五号雷达:https://www.5radar.com/result?key=EgoThink

数据合作广告位

社区讨论

近期热门
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

二维码
关注我们