ptx和SASS学习

本文详细介绍了PTX编程中从头部信息、共享内存声明到内核函数、寄存器变量、参数加载、线程块索引计算、全局内存地址计算以及数据加载和存储的过程,揭示了GPU计算的基本流程。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

一 PTX例子1整体流程

1.1 头部信息

.version 8.2

.target sm_86

.address_size 64

  • .version 8.4:指定PTX代码的版本。
  • .target sm_86:目标架构是SM(Streaming Multiprocessor)86,代表某一代NVidia GPU架构。
  • .address_size 64:使用64位地址空间。

1.2 声明共享内存

.extern .shared .align 16 .b8 global_smem[];

 1.3 内核函数声明

.visible .entry reshape_kernel_block_ptr_v2_0d1d2de3c4de5c6de7de(

    .param .u64 reshape_kernel_block_ptr_v2_0d1d2de3c4de5c6de7de_param_0,

    .param .u64 reshape_kernel_block_ptr_v2_0d1d2de3c4de5c6de7de_param_1,

    .param .u32 reshape_kernel

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

youzjuer

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值