Gadget-2在一个加速卡异构平台上的移植与优化
摘要
【目的】本文在国产加速卡异构平台上,对基于BH-树方法和粒子网格方法的并行天文N体模拟软件Gadget-2进行了移植优化。【方法】基于HIP将Gadget-2中最耗时的短程力计算部分移植到加速卡上,包括本地树的遍历,并对结构体数组进行重构,同时充分利用寄存器与共享内存,提高设备端的访存效率。【结果】数值结果表明,移植优化的版本整体性能加速13.27倍,短程力计算加速35.67倍,并行效率达到57.29%,功率谱结果验证了移植优化的正确性。【结论】本文实现了天文N体模拟软件Gadget-2在加速卡异构平台上的移植和优化,并为大规模宇宙学模拟提供支撑。
关键词: N体问题; TreePM; 高性能异构平台; HIP
引言
N体问题描述了多个粒子在经典力学下的运动规律,是广泛运用于天体物理学和分子动力学等多个重要领域中的基本问题之一。为了能够更加精准地预测宇宙中物质的分布以及预想模型的正确性,往往需