文章目录 前言 专栏概括 1、cuda教程目录 2、cuda教程背景 3、cuda教程内容 一、CPU与GPU运行原理 二、CUDA架构原理 三、核函数数据流方式 四、设备定义(host/device/dram) 五、核函数线程原理(grid/block/thread/warp) 六、内存机制(全局内存、纹理内存、共享内存等) 七、CUDA流认识(SP/SM) 八、CUDA信息查询 gpu信息查询代码 gpu信息查询结果 前言 学习我的教程专栏,你将绝对能实现CUDA工程化,实现环境安装、index计算、kernel核函数编程、内存优化与steam性能优化、原子操作、nms的cuda算子、yolov5的cuda部署等内容,并开源教程源码。 欲速则不达,工程化编程也需理解其工作本质,本篇带领读者了解CUDA工作原理等知识。 专栏概括 1、cuda教程目录 第一章 指针篇–>点击这里 第二章 CUDA原理篇–>点击这里 第三章 CUDA编译器环境配置篇–>点击这里 第四章 kernel函数基础篇–>点击这里