optimizer.zero_grad()、loss.backward()、optimizer.step()

SmartDemo

于 2023-08-05 11:48:41 发布

阅读量224

点赞数

文章标签： python

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/SmartDemo/article/details/132117462

版权

1、Theory

loss.backward() computes dloss/dx for every parameter x which has requires_grad=True. These are accumulated into x.grad for every parameter x. In pseudo-code:

x.grad += dloss/dx

optimizer.step updates the value of x using the gradient x.grad. For example, the SGD optimizer performs:

x += -lr * x.grad

optimizer.zero_grad() clears x.grad for every parameter x in the optimizer. It’s important to call this before loss.backward(), otherwise you’ll accumulate the gradients from multiple passes.

If you have multiple losses (loss1, loss2) you can sum them and then call backwards once:

loss3 = loss1 + loss2
loss3.backward()

2、Example

if you have “net2” which is a pretrained network and you want to backprop the gradients of the loss of “net2” into “net1”. In pseudo-code:

import torch
from torch import optim


def train(n_epoch):
    net1 = model1()
    net2 = model2(pretrained=True)
    optim1 = optim.SGD(net1.parameters(), lr=0.1)

    for epoch in range(n_epoch):
        for data in dataloader:
            net2.eval()
            with torch.no_grad():
                loss2 = net2(data)

            net1.train()
            optim1.zero_grad()
            loss1 = net1(data)
            total_loss = loss1 + loss2
            total_loss.backward()
            optim1.step()

参考： What does the backward() function do? - autograd - PyTorch Forums

博客等级

码龄7年

132
原创

407
点赞

1421
收藏

175
粉丝

关注

私信

分类专栏

Python 32篇
SQL 4篇
人工智能/机器学习/深度学习 15篇
书籍阅读 6篇
算法 20篇
求职
配置 6篇
项目 3篇
文字 1篇
PyQt 1篇

最新评论

Image\Numpy\Tensor互相转化
CSDN-Ada助手: Python入门技能树或许可以帮到你：https://edu.csdn.net/skill/python?utm_source=AI_act_python
logging日志实操入门
北风之神c: 总结的很全面，写得赞，博主用心了。此国产日志 https://nb-log-doc.readthedocs.io/zh-cn/latest/articles/c1.html 使用原生 loggng封装，兼容性和替换性100%,只需要一行代码大幅简化logging的使用。 1、日志能根据级别能够自动变彩色。 1 2、print自动变彩色。 3、日志和print在pycahrm控制台的输出都自动可以点击跳转到文件和行号。 4、多进程日志切割安全，文件日志写入性能高。 5、入参简单，能一键自动记录到多种地方。 6、 nb_log 兼容包含loguru色彩模式,loguru只是nb_log的子集之一. 相比 loguru 有10胜。 pip install nb_log 。
pip超时解决方案
CSDN-Ada助手: 哇, 你的文章质量真不错，值得学习！不过这么高质量的文章, 还值得进一步提升, 以下的改进点你可以参考下: (1)提升标题与正文的相关性；(2)增加除了各种控件外，文章正文的字数。
python绘制单列堆积柱形图
CSDN-Ada助手: 推荐 Python入门技能树：https://edu.csdn.net/skill/python?utm_source=AI_act_python
python绘制单列堆积柱形图
CSDN-Ada助手: Python入门技能树或许可以帮到你：https://edu.csdn.net/skill/python?utm_source=AI_act_python

大家在看

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。