five
五号数据雷达
产品上架
产权登记
知识产权
公共数据
首页 / 开源数据市场 / 正文

Meta FAIR发布Action100M数据集,应用在视频动作识别、视频理解领域

五号数据雷达开源数据市场2026-01-17 11:0328
Action100M是Meta FAIR发布的数据集,于2026-01-16首发在arXiv应用于视频动作识别、视频理解领域

Meta FAIR本次发布的数据集Action100M,Action100M是由Meta FAIR等机构联合构建的大规模视频动作数据集,包含来自120万条互联网教学视频的1.47亿个时序标注片段,总时长相当于14.6年。数据集通过自动化流水线生成,采用V-JEPA 2嵌入进行分层时序分割,并组织为树状多级字幕结构,最终通过GPT-OSS-120B推理模型输出结构化标注。其21.3亿单词量的丰富标注支持开放词汇动作识别,在VL-JEPA模型训练中展现出卓越的零样本性能,为视频理解与物理世界建模研究提供了新基准。

查看Action100M

README内容:

 

关于Meta FAIR,Meta FAIR(Fundamental AI Research)是Meta公司旗下的人工智能研究实验室,致力于推动人工智能领域的基础研究,涵盖机器学习、计算机视觉、自然语言处理等多个方向。

关于arXiv,arXiv 是一个免费分发服务和开放获取的学术文章档案库,涵盖了物理学、数学、计算机科学、定量生物学、定量金融、统计学、电气工程和系统科学以及经济学等领域。该网站上的材料并未经过 arXiv 的同行评审。

数据合作广告位

社区讨论

近期热门
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

二维码
关注我们