Amazon Web Services 本次发布的数据集 TabArena, TabArena是一个持续维护的表格数据机器学习模型基准测试系统。它通过手动挑选代表现实世界表格数据任务的51个数据集和16个表格机器学习模型,运行大规模的基准测试研究,以初始化一个公共排行榜。TabArena旨在提供一个可靠的评估环境,允许研究人员和从业者比较不同的机器学习模型。数据集经过精心挑选,以确保它们具有代表性,并且适用于独立同分布的表格分类和回归任务。TabArena的创建过程涉及模型的实现、超参数优化、数据集的挑选和评估设计。它旨在通过不断更新和改进来保持其相关性和可靠性,并通过开源项目的方式由社区共同维护。
关于 arXiv , arXiv 是一个免费分发服务和开放获取的学术文章档案库,涵盖了物理学、数学、计算机科学、定量生物学、定量金融、统计学、电气工程和系统科学以及经济学等领域。该网站上的材料并未经过 arXiv 的同行评审。





_1769672084863.jpg)