
python异常错误
文章平均质量分 52
Pengsen Ma
这个作者很懒,什么都没留下…
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
pyhton在windows上创建文件,文件名过长导致错误
windows创建的文件名的最长是260【是带着路径的长度,不是单纯的文件的长度。原创 2025-07-01 09:18:56 · 296 阅读 · 0 评论 -
pycharm debug的时候无法debug到指定的位置就停住不动了
后来才发现是自己 import 自己定义的datasets的时候出现了错误,因为我是在自己定义的datasets中进行了测试,但是里面有错误,然后我还在主程序中import了这个datasets,所以一直停住不动。# print(f"\n--- 开始为任务组合: {task_key} 准备数据和模型 (Paired Data) ---")# task_key = '+'.join(current_task_names) # 创建任务组合的键名。# # --- 主训练循环 ---原创 2025-05-29 15:20:33 · 1188 阅读 · 0 评论 -
pycharm debug怎么鼠标划了某个表达式自动执行命令,然后给出结果(怎么划线自动执行)
现在的情况是划取了某个表达式,但是不自动执行了,应该重新设置一下。原创 2025-04-11 09:36:35 · 136 阅读 · 0 评论 -
【异常错误】No module named ‘taming.modules.vqvae‘
或者提前下载好()这个先下载好。然后cd进入该包成功。原创 2025-03-01 19:43:16 · 532 阅读 · 0 评论 -
【异常错误】pycharm debug view变量的时候显示不全,中间会以...显示
这个是在新版的pycharm中出现的,在setting中这么设置一下就好了:https://youtrack.jetbrains.com/issue/PY-75568/Large-strings-truncated-when-displayed-in-debug-output-or-evaluate-windows-again原创 2025-02-19 20:33:14 · 568 阅读 · 0 评论 -
【异常错误】XXX has been marked as ready twice
当使用多卡的时候“ --num_processes=2” 【 accelerate launch --num_processes=2 train.py 】原创 2025-02-19 10:43:00 · 491 阅读 · 0 评论 -
Could not load dynamic library ‘libcudart.so.11.0‘、Could not load dynamic library ‘libcudnn.so.8‘
https://stackoverflow.com/questions/70967651/could-not-load-dynamic-library-libcudart-so-11-0Output in my system.This result shows where the “libcudart.so.11.0” is in my system:原创 2025-01-05 11:07:47 · 317 阅读 · 0 评论 -
【WSL 异常错误】WslRegisterDistribution failed with error: 0x8000000d
Ubuntu-18.04替换为你自己的版本。然后就可以执行下一步操作了。原创 2024-11-26 19:00:49 · 1343 阅读 · 0 评论 -
No module named ‘sascorer‘
或者安装比它版本更高的版本。原创 2024-11-24 17:01:10 · 192 阅读 · 0 评论 -
pycharm使用debug的时候遇到断点不停的问题
3.如果能走到那一步,但是依然没有在附近停下,而且你用了多卡并行,那么就可能是Gevent compatible的问题。在设置Build,Execution,Deployment->Python Debugger里面取消勾选Gevent兼容。2.尝试在你打期望停下的代码附近print("1111111")看看是否输出了这个字符串,验证程序确实走到这一步了。1.首先尝试在程序最开头打断点,检查是否能停下,如果可以,看第二步。原创 2024-11-23 20:45:02 · 1487 阅读 · 0 评论 -
Win + L(锁屏)以后,Compile with `TORCH_USE_CUDA_DSA` to enable device-side assertions.
起初我以为是代码哪里写错了,后面发现每次win + L一段时间以后就会出现这个错误。原创 2024-11-23 13:40:19 · 379 阅读 · 0 评论 -
【异常错误】ModuleNotFoundError: No module named ‘onmt‘
pip installOpenNMT-py原创 2024-10-12 15:32:47 · 231 阅读 · 0 评论 -
【异常错误】self.atom_encoder(x),RuntimeError: CUDA error: device-side assert triggered
应该用1.2.6处理数据,然后用1.2.6去运行,而不是用1.3.6版本。原创 2024-10-11 11:05:33 · 493 阅读 · 0 评论 -
【异常错误】RuntimeError: CUDA error: device-side assert triggered 遇到这种错误怎么办? CUDA_LAUNCH_BLOCKIN=1
运行的时候突然就这样了main(args)这种错误一般直接看不出出来到底是哪里错误了,不知道错误的原因是因为CPU和gpu的异步执行:cuda编程默认使用异步执行,大概是因为CPU和GPU的内存是分开的。用户想要将数据从GPU搬运到CPU,必须发起一个kernel launch。因此,当程序执行正确时,GPU异步与同步执行的结果应该是等价的。原创 2024-10-10 09:12:12 · 1361 阅读 · 0 评论 -
异常错误:([4, 512]) from checkpoint, the shape in current model is torch.Size([5, 512]). ogb包的版本问题
1.3.6的版本会将原子变为5,而以前的老版本会是4,所以只需要。原创 2024-10-09 22:06:49 · 340 阅读 · 0 评论 -
【异常错误】新的一个epoch开始的时候,损失又回到了原来没训练之前的样子
从epoch A到epochA+1时loss突然变大很多,模型没有用到上次epoch训练的参数,这是不正确的。原创 2024-08-28 15:18:30 · 379 阅读 · 0 评论 -
【异常错误】训练过程中测试生成模型生成的图像好,但是在单独测试的时候很差
在训练模型的时候,每次训练完一个epoch会紧接着来一个测试函数(使用本次的ckpt生成一些图片看效果),发现本次epoch的效果挺好。但是新开了一个terminal,然后使用evaluation对该epoch进行测试(生成新图像),但是效果很差,明明已经resume了训练好的epoch对应的ckpt了啊。原创 2024-08-28 13:40:50 · 315 阅读 · 0 评论 -
【异常错误】pycharm可以在terminal中运行,但是无法在run中运行(没有输出错误就停止了)
pycharm的命令可以在terminal中运行,但是复制到无法在run中运行(没有输出错误就停止了)搞不懂为什么。原创 2024-08-25 10:01:40 · 580 阅读 · 0 评论 -
【异常错误】wandb运行后显示“wandb No such file or directory”
将所有带有wandb的进行kill即可。这个没有什么好办法。原创 2024-08-19 21:28:04 · 185 阅读 · 0 评论 -
杀死未知占用显存的python程序 / 杀死所有python进程
有时候我们在运行程序的时候,例如使用nohup等方式运行的时候,代码出现了错误,但是进程却卡死了,导致显存一直占用,我们通过nvidia-smi也无法知道到底谁占用了显存。有一种很简单的方法,就是杀死所有的当前在运行的朋友thin程序。原创 2024-08-19 16:49:57 · 415 阅读 · 0 评论 -
【异常错误】Compile with `TORCH_USE_CUDA_DSA` to enable device-side assertions.
我是直接将y变为了(1,512),但是现在的y的值位于[0-1485]之间,所以导致无法找到该embedding,这种错误,在CPU调试的时候可以出现,但是GPU报错太抽象。得知,应该是我在推理过程中使用了较短的Embedding,导致无法找到该类对应的标签。在运行项目的时候,出现了错误,但是却不知道为什么错误,因为GPU报的错误太抽象。直接删除这一行即可,或者修改nn.Embedding的字典的大小。整得人头晕,不知道咋回事。原创 2024-07-09 15:46:09 · 3783 阅读 · 0 评论 -
【异常错误】‘NoneType‘ object has no attribute ‘GetSubstructMatches‘
在epoch运行过程中,突然出现了这种错误,感觉可能是rdkit版本的问题,此时将rdkit的版本改为了最新的版本。暂时没有错误,等等看看再说。原创 2024-07-07 17:20:18 · 425 阅读 · 0 评论 -
WPS图片无法居中、居中按钮无法点击(是灰色的)
在PPT中复制对象到WPS word中后,导致图片一直靠左,而无法居中。正确的是选中图片的前面的部分,然后点击居中,或者Ctrl + E。这时你会发现居中按钮无法点击(是灰色的)原创 2024-07-01 20:11:31 · 2020 阅读 · 0 评论 -
resume不严格加载model、避免某些层维度不一致导致错误
在resume模型的时候,可能会遇到某些层是没有的,或者你改变了某些层的维度,从而导致model_state_dict()错误,所以此时的解决办法为:忽略这些层,不加载它们。原创 2024-06-27 16:12:45 · 484 阅读 · 0 评论 -
【异常错误】归一化导致的图像生成颜色偏差
由于归一化的问题,会导致生成的图像颜色偏差严重,例如会导致生成的颜色偏红黑色、淡色、青色..如果你生成的图像整体感官上没有问题,但是却在颜色上有很大偏差,那么很大可能就是你训练的时候归一化的程序不对。原创 2024-06-25 08:16:23 · 907 阅读 · 0 评论 -
【异常错误】为什么使用pycharm打印图像信息的时候全部是255?
正常情况下,一个图片的3通道信息应该是【0-255】不断变化的,但是我使用pycharm打印图像的信息的时候却发现全部是255,这令我非常的苦恼,以至于我认为图像加载错误。原创 2024-06-24 12:33:34 · 343 阅读 · 0 评论 -
【异常错误】 ModuleNotFoundError: No module named ‘torch._six‘
该问题是因为你安装的torch_geometric的版本不对。原创 2024-06-23 15:23:04 · 549 阅读 · 0 评论 -
【异常错误】AttributeError: ‘Data‘ object has no attribute ‘__cat_dim__‘
这是因为torch_geometric的版本太低导致的:原创 2024-06-23 15:18:22 · 588 阅读 · 0 评论 -
【异常错误】ValueError: rdkit.Chem.rdchem.BondType.DATIVE is not in list
在处理MoleculeNet_datasets的HIV数据集的时候出现了下面的错误:35275352763527735278一直不知道错误在哪里。原创 2024-06-23 15:15:33 · 722 阅读 · 0 评论 -
【异常错误】so.11: undefined symbol: cublasLtHSHMatmulAlgoInit, version libcublasLt.so.11
【代码】【异常错误】so.11: undefined symbol: cublasLtHSHMatmulAlgoInit, version libcublasLt.so.11。原创 2024-06-22 18:10:47 · 905 阅读 · 0 评论 -
non_blocking=True 与 torch.cuda.synchronize()
GPU和CPU之间是异步执行的,CPU向GPU下达指令以后会立刻执行之后的代码,CPU不会等待GPU执行完成。原创 2024-06-22 09:45:17 · 947 阅读 · 0 评论 -
Windows11电脑在使用GPU的时候有时候会卡顿
下载好以后,然后安装最新的驱动就可以了,感觉可能是因为win11和某些需要显卡的驱动不支持的原因吧。原来我一直以为是电脑的某些组件可能坏掉了。原创 2024-06-18 14:40:38 · 948 阅读 · 2 评论 -
训练的过程中内存一直增加的问题(内存泄漏)、如何检查是否内存泄漏
【代码】训练的过程中内存一直增加的问题。原创 2024-05-23 21:41:19 · 2124 阅读 · 0 评论 -
RuntimeError: unable to mmap 2048 bytes from file: Cannot allocate memory (12)
运行过程中出现错误: 我查看了内存的大小,发现内存并没有吃满,换了一个电脑设置max_map_count的较大的值,发现可以成功运行不出错,设置方式如下:# 查看当前值# 设置新的值这是对于自己的服务器来说,是可以通过上面的方式进行解决的,但是如果你使用的是租赁的服务器,就会出现错误:sysctl: setting key "vm.max_map_count", ignoring: Read-only file system此时,你并没有办法修改 max_map_count ,你只能使用分布式将程序放在多原创 2024-05-19 16:40:46 · 2202 阅读 · 0 评论 -
【异常错误】unrecognized arguments: --local-rank=1 ERROR:torch.distributed.elastic.multipr
由上图可以看出是–local_rank 与 --local-rank不一致导致的,追究原因,竟然是torch2.0版本launch.py里面写的全是–local-rank,而老版本的torch用的是–local_rank。所以将local_rank全改成local-rank即可。原创 2024-05-13 19:40:56 · 1589 阅读 · 0 评论 -
【异常错误】运行命令后卡死不动、mpi4py的安装方法、运行带有mpi4py的py程序卡死
今天在运行程序的时候出现了一个很不常见的异常,当我运行py脚本后,发现没有任何反应,然后我一行一行的debug,发现执行到下面一行的时候就会卡死:后面才发现,你不要而是要错误消失.0...原创 2024-05-12 21:24:51 · 501 阅读 · 1 评论 -
【异常错误】Hint: enable anomaly detection to find the operation that failed to compute its gradient
main(args)原创 2024-04-24 14:59:58 · 487 阅读 · 0 评论 -
【异常错误】RTX 4090 nvcc fatal : Unsupported gpu architecture ‘compute_89‘
原因是conda环境下cuda编译器nvcc不支持compute_89导致安装失败,运行项目的requirement.txt安装环境往往会默认安装低版本的cuda环境。如果没有compute_89(nvcc --version版本是11.5或者以下),就需要重新安装cuda和nvcc。如果nvcc目录不是/usr/local/cuda-12.2 ,需要重新配置,先备份下原环境,然后重新配置。安装完成后,可以查看cuda 12.2版本安装位置。一般在/usr/local/cuda-12.2下。原创 2024-04-17 11:20:26 · 6576 阅读 · 0 评论 -
pycharm debug 的时候 waiting for process detach、pycharm无法stop
当你使用pycharm debug或者run的时候,突然出现了点不动,然后一直显示:waiting for process detach。原创 2024-04-11 09:02:46 · 2328 阅读 · 1 评论 -
tmux 替换 nohup
训练的时候,如果是保持命令行窗口不关闭,则不会出现这个问题;如果是使用nohup挂在后台运行,则没多久就会出现这个问题。在网上找了下解决办法,发现使用tmux替代nohup是一个可行的方案。原创 2024-04-09 17:10:58 · 1011 阅读 · 0 评论