英伟达本次发布的数据集SOL-ExecBench,SOL-ExecBench是由英伟达团队构建的GPU内核优化基准数据集,包含从124个生产级及新兴AI模型中提取的235个CUDA内核优化问题,覆盖语言、扩散、视觉、音频、视频及混合架构领域。数据集针对NVIDIA Blackwell GPU设计,包含BF16、FP8和NVFP4精度下的前向与反向计算任务,其核心创新在于以硬件速度极限(Speed-of-Light)作为性能评估标准而非传统软件基线。数据来源包括HuggingFace、Artificial Analysis和arXiv的模型,通过LLM辅助流程从7,400个子图中筛选生成,并配备沙盒化评估工具链。该数据集旨在推动AI代理系统开发接近硬件极限的高效内核,解决快速迭代的GPU特性与复杂模型需求之间的优化鸿沟问题。
README内容:
关于英伟达,英伟达是一家专注于图形处理器开发的全球知名技术公司。
关于arXiv,全球最大的预印本学术论文数据库,涵盖物理、数学、计算机科学等多个学科领域。





_1769672084863.jpg)