首页 / 开源数据市场 / 正文

算法研究小组发布 ML Research Benchmark (MLRB) 数据集, 应用在机器学习、AI研究领域

五号数据雷达开源数据市场2024-11-01 07:4321

ML Research Benchmark (MLRB) 是算法研究小组发布的数据集,于 2024-10-30 首发在 arXiv 应用于机器学习、AI研究领域

算法研究小组本次发布的数据集 ML Research Benchmark (MLRB), ML Research Benchmark (MLRB) 是由算法研究小组创建的一个用于评估AI代理在机器学习研究和发展中能力的基准数据集。该数据集包含7个从最近的机器学习会议竞赛中提取的任务，涵盖了模型训练效率、有限数据上的预训练、领域特定的微调以及模型压缩等研究活动。这些任务反映了当前机器学习研究的前沿挑战，旨在评估AI代理在复杂研究任务中的表现。通过使用前沿模型如Claude-3和GPT-4o进行评估，数据集提供了一个框架，用于比较和评估AI代理在实际AI研究挑战中的潜力。

查看ML Research Benchmark (MLRB)

README 内容：

关于 arXiv , arXiv 是一个免费分发服务和开放获取的学术文章档案库，涵盖了物理学、数学、计算机科学、定量生物学、定量金融、统计学、电气工程和系统科学以及经济学等领域。该网站上的材料并未经过 arXiv 的同行评审。

社区讨论

近期热门

算法研究小组 发布 ML Research Benchmark (MLRB) 数据集, 应用在 机器学习、AI研究 领域

README 内容：

社区讨论

算法研究小组发布 ML Research Benchmark (MLRB) 数据集, 应用在机器学习、AI研究领域