RuntimeError: CUDA error: device-side assert triggered 解决思路之一 & pycarm debug功能出错的解决

本文探讨了CUDA运行时错误'CUDA error: device-side assert triggered'的可能原因,特别是在深度学习中使用嵌入层时遇到的问题。由于-1在词嵌入中是非法的,导致了CUDA kernel的错误。错误定位的挑战在于,错误并不一定出现在报错的代码行。解决方案包括确保所有输入数据都在有效范围内,并使用CUDA_LAUNCH_BLOCKING进行同步调试。此外,还提到了PyCharm远程调试时参数加载延迟的问题。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

RuntimeError: CUDA error: device-side assert triggered

CUDA kernel errors might be asynchronously reported at some other API call,so the stacktrace below might be incorrect.
For debugging consider passing CUDA_LAUNCH_BLOCKING=1.

可能的情况:有地方数组越界了(下标大于原长或下标小于0)
最坑的是,报错点不一定是真错的地方。需要仔细debug

例如

        embd = nn.Embedding(5002, 512).to(device)
        word_ind_tensor = [[27,90,93],[19,-1,96],[84,29,9]]	#注意这里有 -1 ,是问题所在
        word_ind_tensor = torch.tensor(word_ind_tensor ).to(device)  #类型转换
        enc_outputs = embd(word_ind_tensor).to(device)
		#调试时,word_ind_tensor 的内容为:Unable to get repr for <class 'torch.Tensor'>

在embedding过程中,代编码的tensor中不能有小于0与大于你设置范围的数,否则会报错。

pycharm连接服务器debug,参数值有时候一直在加载出不来

解决方法:
文件-设置-搜索gevent兼容

评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值