five
五号数据雷达
产品上架
产权登记
知识产权
公共数据
首页 / 开源数据市场 / 正文

算法研究小组 发布 ML Research Benchmark (MLRB) 数据集, 应用在 机器学习、AI研究 领域

五号数据雷达开源数据市场2024-11-01 07:4321
ML Research Benchmark (MLRB) 是 算法研究小组 发布的数据集,于 2024-10-30 首发在 arXiv 应用于 机器学习、AI研究 领域

算法研究小组 本次发布的数据集 ML Research Benchmark (MLRB), ML Research Benchmark (MLRB) 是由算法研究小组创建的一个用于评估AI代理在机器学习研究和发展中能力的基准数据集。该数据集包含7个从最近的机器学习会议竞赛中提取的任务,涵盖了模型训练效率、有限数据上的预训练、领域特定的微调以及模型压缩等研究活动。这些任务反映了当前机器学习研究的前沿挑战,旨在评估AI代理在复杂研究任务中的表现。通过使用前沿模型如Claude-3和GPT-4o进行评估,数据集提供了一个框架,用于比较和评估AI代理在实际AI研究挑战中的潜力。

查看ML Research Benchmark (MLRB)

README 内容: 

 

关于 arXiv , arXiv 是一个免费分发服务和开放获取的学术文章档案库,涵盖了物理学、数学、计算机科学、定量生物学、定量金融、统计学、电气工程和系统科学以及经济学等领域。该网站上的材料并未经过 arXiv 的同行评审。

数据合作广告位

社区讨论

近期热门
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

二维码
关注我们