源代码大师
希望我的博客,能帮上你解决学习中工作中所遇到的问题
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
CUDA:工作负载遵循CPU预处理->GPU处理->CPU后处理的形式的实例
CUDA:工作负载遵循CPU预处理->GPU处理->CPU后处理的形式的实例原创 2022-12-21 12:30:34 · 406 阅读 · 0 评论 -
CUDA:CUDA事件在GPU计时和重叠的CPU和GPU执行的实例(附完整源码)
CUDA:CUDA事件在GPU计时和重叠的CPU和GPU执行的实例(附完整源码)原创 2022-12-21 11:19:30 · 357 阅读 · 0 评论 -
CUDA:实现多GPU的一维卷积(附完整源码)
CUDA:实现多GPU的一维卷积(附完整源码)原创 2024-03-05 00:23:18 · 274 阅读 · 0 评论 -
CUDA:实现使用CUFFT计算二维卷积(附完整源码)
CUDA:实现使用CUFFT计算二维卷积(附完整源码)原创 2024-03-05 00:21:40 · 275 阅读 · 0 评论 -
CUDA:实现使用CUFFT计算带有过滤的信号的1维卷积(附完整源码)
CUDA:实现使用CUFFT计算带有过滤的信号的1维卷积(附完整源码)原创 2024-03-05 00:20:18 · 143 阅读 · 0 评论 -
CUDA:实现使用CURAND产生伪随机和准随机算法(附完整源码)
CUDA:实现使用CURAND产生伪随机和准随机算法(附完整源码)原创 2024-03-05 00:17:38 · 208 阅读 · 0 评论 -
CUDA:实现使用NVGRAPH库计算单源最短路径(附完整源码)
CUDA:实现使用NVGRAPH库计算单源最短路径(附完整源码)原创 2024-03-05 00:16:19 · 122 阅读 · 0 评论 -
CUDA:实现使用NVGRAPH库进行半环向量乘法(附完整源码)
CUDA:实现使用NVGRAPH库进行半环向量乘法(附完整源码)原创 2024-03-05 00:14:58 · 61 阅读 · 0 评论 -
CUDA:实现模拟梅森旋转算法(附完整源码)
CUDA:实现模拟梅森旋转算法(附完整源码)原创 2024-03-05 00:12:35 · 122 阅读 · 0 评论 -
CUDA:实现使用cuRAND产生随机数(附完整源码)
CUDA:实现使用cuRAND产生随机数(附完整源码)原创 2024-03-05 00:11:02 · 504 阅读 · 0 评论 -
CUDA:实现使用蒙特卡罗方法模拟简单亚式期权(附完整源码)
CUDA:实现使用蒙特卡罗方法模拟简单亚式期权(附完整源码)原创 2024-03-05 00:10:04 · 236 阅读 · 0 评论 -
CUDA:实现使用蒙特卡罗方法模拟π(附完整源码)
CUDA:实现使用蒙特卡罗方法模拟π(附完整源码)原创 2024-03-05 00:08:50 · 262 阅读 · 0 评论 -
CUDA:实现使用NNP把图片数据直方图均值化(附完整源码)
CUDA:实现使用NNP把图片数据直方图均值化(附完整源码)原创 2024-03-05 00:07:44 · 109 阅读 · 0 评论 -
CUDA:实现使用cuSolverSP底层API实现QR因式分解(附完整源码)
CUDA:实现使用cuSolverSP底层API实现QR因式分解(附完整源码)原创 2024-03-05 00:06:17 · 212 阅读 · 0 评论 -
CUDA:实现使用cuSolverSP底层API实现Cholesky因式分解(附完整源码)
CUDA:实现使用cuSolverSP底层API实现Cholesky因式分解(附完整源码)原创 2024-03-05 00:05:06 · 120 阅读 · 0 评论 -
CUDA:实现cuSolverSP的LU, QR和Cholesky因式分解(附完整源码)
CUDA:实现cuSolverSP的LU, QR和Cholesky因式分解(附完整源码)原创 2024-03-04 23:44:17 · 254 阅读 · 0 评论 -
CUDA:实现重新因子化(附完整源码)
CUDA:实现重新因子化(附完整源码)原创 2024-03-04 23:43:00 · 72 阅读 · 0 评论 -
CUDA:实现cuSolverDN的LU, QR和Cholesky因式分解(附完整源码)
CUDA:实现cuSolverDN的LU, QR和Cholesky因式分解(附完整源码)原创 2024-03-04 23:41:24 · 253 阅读 · 0 评论 -
CUDA:实现使用统一内存和CUBLAS and CUSPARSE库实现共轭梯度计算(附完整源码)
CUDA:实现使用统一内存和CUBLAS and CUSPARSE库实现共轭梯度计算(附完整源码)原创 2024-03-04 23:40:01 · 116 阅读 · 0 评论 -
CUDA:实现使用CUBLAS and CUSPARSE库实现前承条件共轭梯度计算(附完整源码)
CUDA:实现使用CUBLAS and CUSPARSE库实现前承条件共轭梯度计算(附完整源码)原创 2024-03-04 23:32:41 · 112 阅读 · 0 评论 -
CUDA:实现使用CUBLAS and CUSPARSE库实现共轭梯度计算(附完整源码)
CUDA:实现使用CUBLAS and CUSPARSE库实现共轭梯度计算(附完整源码)原创 2024-03-04 23:31:18 · 157 阅读 · 0 评论 -
CUDA:实现边缘检测过滤器(附完整源码)
CUDA:实现边缘检测过滤器(附完整源码)原创 2024-03-04 23:29:15 · 111 阅读 · 0 评论 -
CUDA:实现把输入图片搞成灰度图片(附完整源码)
CUDA:实现把输入图片搞成灰度图片(附完整源码)原创 2024-03-04 23:27:56 · 54 阅读 · 0 评论 -
CUDA:实现使用NPP盒式过滤器函数执行盒式过滤(附完整源码)
CUDA:实现使用NPP盒式过滤器函数执行盒式过滤(附完整源码)原创 2024-03-04 23:26:36 · 302 阅读 · 0 评论 -
CUDA:实现使用CUSPARSE和CUBLAS对有限的对称和非对称线性系统的稳定双共轭梯度(附完整源码)
CUDA:实现使用CUSPARSE和CUBLAS对有限的对称和非对称线性系统的稳定双共轭梯度(附完整源码)原创 2024-03-04 23:25:25 · 84 阅读 · 0 评论 -
CUDA:实现使用批量的CUBLAS的API提高程序性能(附完整源码)
CUDA:实现使用批量的CUBLAS的API提高程序性能(附完整源码)原创 2024-03-04 23:22:36 · 276 阅读 · 0 评论 -
CUDA:实现矩阵转置(附完整源码)
CUDA:实现矩阵转置(附完整源码)原创 2024-03-04 23:21:10 · 86 阅读 · 0 评论 -
CUDA:实现使用thread Fence来进行规约(附完整源码)
CUDA:实现使用thread Fence来进行规约(附完整源码)原创 2024-03-04 23:18:25 · 57 阅读 · 0 评论 -
CUDA:实现双调排序奇偶合并排序(附完整源码)
CUDA:实现双调排序奇偶合并排序(附完整源码)原创 2024-03-04 23:16:55 · 301 阅读 · 0 评论 -
CUDA:使用了HyperQ技术实现流中多个Kernel并行(附完整源码)
CUDA:使用了HyperQ技术实现流中多个Kernel并行(附完整源码)原创 2024-03-04 23:14:32 · 153 阅读 · 0 评论 -
CUDA:实现使用shuffle(线程束混洗)来进行扫描(附完整源码)
CUDA:实现使用shuffle(线程束混洗)来进行扫描(附完整源码)原创 2024-03-02 13:29:26 · 197 阅读 · 0 评论 -
CUDA:实现基于Boruvka的MST算法(附完整源码)
CUDA:实现基于Boruvka的MST算法(附完整源码)原创 2024-03-02 13:27:59 · 143 阅读 · 0 评论 -
CUDA:实现扫描算法(附完整源码)
CUDA:实现扫描算法(附完整源码)原创 2024-03-02 13:26:58 · 196 阅读 · 0 评论 -
CUDA:实现标量相乘(附完整源码)
CUDA:实现标量相乘(附完整源码)原创 2024-03-02 13:25:58 · 105 阅读 · 0 评论 -
CUDA:实现使用Thrust库进行超级快而且高效并行的基数排序(附完整源码)
CUDA:实现使用Thrust库进行超级快而且高效并行的基数排序(附完整源码)原创 2024-03-02 13:24:02 · 418 阅读 · 0 评论 -
CUDA:实现使用驱动API从PTX即时编译Kernel。并展示了运行时和驱动API互操作性的无缝衔接(附完整源码)
CUDA:实现使用驱动API从PTX即时编译Kernel。并展示了运行时和驱动API互操作性的无缝衔接(附完整源码)原创 2024-03-02 13:22:53 · 136 阅读 · 0 评论 -
CUDA:实现展示在设备上动态new 和 delete空间和声明虚函数(附完整源码)
CUDA:实现展示在设备上动态new 和 delete空间和声明虚函数(附完整源码)原创 2024-03-02 13:21:23 · 219 阅读 · 0 评论 -
CUDA:实现归并排序(附完整源码)
CUDA:实现归并排序(附完整源码)原创 2024-03-02 13:20:10 · 346 阅读 · 0 评论 -
CUDA:实现在运行时链接驱动并且即时编译PTX代码(附完整源码)
CUDA:实现在运行时链接驱动并且即时编译PTX代码(附完整源码)原创 2024-03-02 13:19:04 · 348 阅读 · 0 评论 -
CUDA:实现视线算法(附完整源码)
CUDA:实现视线算法(附完整源码)原创 2024-03-02 13:17:39 · 116 阅读 · 0 评论