随着科学机器学习(SciML)成为AI技术渗透硬核科研场景的核心方向,高精度、标准化的科研数据集已成为支撑核工程、天体物理、高能物理等领域数值模拟效率提升的核心基础设施。其中,辐射传输方程(RTE)求解广泛应用于放疗剂量计算、聚变装置设计、恒星大气模拟等多个场景,传统数值方法计算成本极高,采用神经代理模型替代求解的技术路线近年来受到学界广泛关注,但长期缺乏统一的模型性能验证基准。
NVIDIA本次发布的数据集Linear-Radiation-Transport,是专门面向最终时间二维线性辐射传输方程点云代理建模场景打造的基准数据集,包含两个互补的基准测试模块,可从不同维度评估神经代理模型的泛化能力。 Lattice 基准包含 707 个模拟样本(494 个训练,106 个验证,107 个测试)。其几何结构固定为 `7 × 7` 的方块阵列,每个样本的变化在于白色背景区域的散射系数(σ_s ∈ [0.1, 10.1])和蓝色吸收块的吸收截面(σ_a ∈ [5, 105])。关注的物理量是最终时刻在吸收块区域上的吸收积分 (int_B sigma_a, phi, dx)。 Hohlraum 基准包含 846 个模拟样本(592 个训练,126 个验证,128 个测试)。其各区域材料截面固定,每个样本的变化由 8 个几何参数控制,这些参数决定了两个固定在壁上的红色条带的内边缘和 y 向范围,以及一个中心插件的 (x, y) 偏移量。关注的物理量是最终时刻在三个材料区域(中心插件、垂直条带、水平条带)上的吸收积分。
所有数据均通过 KiT-RT 求解器生成,采用了离散坐标(S_N)角离散化、非结构化网格上的有限体积格式和显式 SSP Runge-Kutta 时间积分器,并整理为 PhysicsNeMo `Mesh` 内存映射格式,可直接适配主流科学机器学习框架调用。数据集总共有 1,553 个模拟,每个样本是一个非结构化三角网格(点云),包含约 70k 至 81k 个单元。每个单元的数据包括单元面积、吸收截面(sigma_a)、散射截面(sigma_s)、总截面(sigma_t)、源项(Q)、材料属性(material_properties)以及标量通量(scalar_flux,包含初始和最终时刻两个快照)。此外,还包含单元中心坐标(2D)和每个模拟的全局元数据(如模拟时间、通量统计等)。
该数据集适用于训练、评估和基准测试点云/网格基础的神经代理模型,用于线性辐射传输的最终时间预测。两个基准测试提供了互补的压力测试:Lattice 测试模型在固定几何下对材料参数的泛化能力,而 Hohlraum 测试模型在固定材料参数下对几何的泛化能力。它适用于图神经网络、神经算子、点云回归器以及基于 KiT-RT 参考解进行混合保真度或不确定性量化的研究。 从应用场景来看,基于该数据集训练优化后的神经代理模型,未来可广泛应用于核反应堆辐射屏蔽设计、惯性约束聚变靶腔辐射分布模拟、天体物理恒星内部辐射传输计算、肿瘤放疗剂量精准规划等多个领域,有望将原本需要数小时甚至数天的数值模拟过程压缩至秒级,大幅降低相关科研与工程场景的计算成本。 作为全球领先的AI计算厂商,NVIDIA本次发布的科学数据集,进一步完善了科学机器学习领域的基础设施供给,统一了辐射传输方向神经代理模型的性能验证标准,降低了不同研究团队成果比对的门槛,对于推动科学AI在硬核工业与科研场景的落地具有重要意义。





_1769672084863.jpg)