【NLP】因果卷积（causal）与扩展卷积（dilated）

最新推荐文章于 2025-04-15 16:34:54 发布

阿木鸣

最新推荐文章于 2025-04-15 16:34:54 发布

阅读量5.9k

点赞数 1

CC 4.0 BY-SA版权

分类专栏： NLP

原文链接：https://blog.csdn.net/tonygsw/article/details/81280364

NLP 专栏收录该内容

4 篇文章

订阅专栏

本文深入探讨了因果卷积在序列问题中的应用，特别是在处理时间序列数据时的优势，以及如何通过引入扩展卷积解决传统因果卷积的局限性，实现更大范围的感受野，提升模型预测精度。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

因果卷积：

因为要处理序列问题（即要考虑时间问题，）就不能使用普通的CNN卷积，必须使用新的CNN模型，这个就是因果卷积的作用，看下面一个公式，对与序列问题（sequence modeling），主要抽象为，根据x1......xt和y1.....yt-1去预测yt，使得yt接近于实际值。

我们根据图片来看下因果卷积的样子，下面这个图片来自：https://deepmind.com/blog/wavenet-generative-model-raw-audio/

上面的图片可以详细的解释因果卷积，但是问题就来，如果我要考虑很久之前的变量x，那么卷积层数就必须增加。卷积层数的增加就带来：梯度消失，训练复杂，拟合效果不好的问题，为了决绝这个问题，出现了扩展卷积（dilated）。

扩展卷积：

对于因果卷积，存在的一个问题是需要很多层或者很大的filter来增加卷积的感受野。本文中，我们通过大小排列来的扩大卷积来增加感受野。扩大卷积（dilated convolution）是通过跳过部分输入来使filter可以应用于大于filter本身长度的区域。等同于通过增加零来从原始filter中生成更大的filter。

这就可以解决因果卷积带来的问题，在示意图中，卷积感受野扩大了1,2,4,8倍。扩大卷积（dilated convolution）可以使模型在层数不大的情况下有非常大的感受野。

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。