DAT（Dual Aggregation Transformer）-CSDN博客

本文链接：https://blog.csdn.net/qq_29788741/article/details/132643853

这是一种用于图像超分辨率 Transformer 模型。DAT 以块间和块内双重方式，聚合空间和通道特征，实现强大的建模能力。

本文提出一种同时利用图像空间和通道特征的 Transformer 模型，DAT（Dual Aggregation Transformer），用于图像超分辨（Super-Resolution，SR）任务。DAT 以块间和块内的双重方式，在空间和通道维度上实现特征聚合，从而具有强大的图像表示能力。具体来说，DAT 在连续的 Transformer 块中交替应用空间和通道自注意力，以实现块间聚合。同时，本文还提出自适应交互模块（Adaptive Interaction Module，AIM）和空间门前馈网络（Spatial-Gate Feed-forward Network，SGFN）来实现块内特征聚合。AIM 从空间与通道为徒改进现有注意力机制，SGFN 在前馈网络中引入了非线性空间信息。实验证明，DAT 实现目前最先进的图像超分辨率性能。

论文链接：https://arxiv.org/abs/2308.03364

代码链接：https://github.com/zhengchen1999/DAT

图像超分辨率（Image Super-Resolution，简称图像 SR）是一种图像处理技术，旨在通过增加图像的细节和清晰度，将低分辨率（LR）图像转换为高分辨率（HR）图像。简单来说，就是将一张小尺寸的模糊图像，变成大尺寸的清晰图像。图像超分辨率技术在实际应用中具有广泛的用途，包括高清电视、监控摄像头、医学影像、卫星图像等。现如今，随着人工智能、机器学习的发展，使用深度学习技术的图像超分辨率成为主流。

方法动机

目前，Transformer 在 SR 任务中表现出色。其核心是自注意力（Self-Attention，SA）机制，能够建立全局依赖关系。而全局关系的建立，对于高分辨率图像的重建尤为重要。然而，全局SA的计算复杂度与图像大小成平方比，这极大的限制了其在高分辨率图像上的应用（这在图像 SR 中很常见）。考虑到这个原因，一些研究人