Multi-gpu问题（1）

不爱吃香菇的干饭少年

于 2023-10-30 17:22:38 发布

阅读量238

点赞数

CC 4.0 BY-SA版权

分类专栏： cuda 文章标签： c语言

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_43594926/article/details/134038610

Multi-gpu问题
域在z方向划分为num_gpus段，其中num_gpus表示可用GPU的数量，然后每个GPU相应地负责一个大小为nx×ny×（nz/num_gpus）的子域。
虽然整个域在主机端表示，但gpu只存储它们的子域。由于更新GPU k（k = 0，…，num_gpus -1）上的磁场和电场分量需要分别来自设备k+1和k-1的场值，因此我们需要在多GPU域分解边界上增加额外的nx×ny细胞来存储这些数据。

1.这些鬼细胞需要先复制到CPU上再进行GPU之间的传递，会增加时间
解决：使用Open-MP API将一个CPU线程分配给一个GPU，这样每个设备在主机上都有自己的上下文

//如果没有在第一个设备上操作
//将电场边界单元从设备复制到主机（顶部）
//在读取更新的幽灵单元之前与其他线程同步

#pragama omp barrier

//如果没有在最后一个设备上运行
//将电场幽灵单元从主机复制到设备
//调用内核，以计算磁场分量

kH<<<dimGrid, dimBlock>>>

最低0.47元/天解锁文章

200万优质内容无限畅学

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。