当前位置: 首页 > news >正文

Gadget-2在一个加速卡异构平台上的移植与优化

摘要

【目的】本文在国产加速卡异构平台上,对基于BH-树方法和粒子网格方法的并行天文N体模拟软件Gadget-2进行了移植优化。【方法】基于HIP将Gadget-2中最耗时的短程力计算部分移植到加速卡上,包括本地树的遍历,并对结构体数组进行重构,同时充分利用寄存器与共享内存,提高设备端的访存效率。【结果】数值结果表明,移植优化的版本整体性能加速13.27倍,短程力计算加速35.67倍,并行效率达到57.29%,功率谱结果验证了移植优化的正确性。【结论】本文实现了天文N体模拟软件Gadget-2在加速卡异构平台上的移植和优化,并为大规模宇宙学模拟提供支撑。

关键词: N体问题; TreePM; 高性能异构平台; HIP

引言

N体问题描述了多个粒子在经典力学下的运动规律,是广泛运用于天体物理学和分子动力学等多个重要领域中的基本问题之一。为了能够更加精准地预测宇宙中物质的分布以及预想模型的正确性,往往需

相关文章:

  • html5手机网站开发教程/深圳网站搜索优化工具
  • 周口网站建设专家/购买域名
  • 潍坊做网站潍坊做网站/链接网
  • 支持ipv6网站开发/网络营销专业怎么样
  • 遵义网站建设哪家强/青岛网站建设方案服务
  • wordpress做招聘网站/小程序开发平台官网
  • 【矩阵论】7.范数理论——基本概念——矩阵范数生成向量范数谱范不等式
  • 还有1个月,乘用车搭载首超5百万辆!L2/L2+前装交付一路狂奔
  • 数商云SRM供应商系统打造家居建材企业完整电商数据生态平台
  • 向内而生 向远而行 | 希尔贝壳荣获“2022年度最具投资价值创新企业”奖
  • android 定时器
  • 联想C2E摄像头的折腾
  • Debezium系列之:认证方式使用kerberos认证SASL/GSSAPI
  • 常用的 Emoji 符号
  • 实验室设计有哪些基本原则
  • 使用 Pygame Zero 构建一个捕捉游戏(详细步骤含源码)
  • Debian系列-在新的GNOME下无法启动Qt
  • 15. 使用stunnel加密tcp数据传输