人工智能算法研究院-CSDN博客

原创 SCI论文解读复现|目录一览表

此栏目解读SCI、EI等英文论文解读，梳理并复现改进创新点，帮助大家将改进点运用于自己的目标检测场景中，助力发论文。

2023-05-27 19:43:56 2687

原创 YOLOv10/YOLOv9/YOLOv8/YOLOv7/YOLOv5系列改进| 目录一览表

YOLO系列算法改进方法（2024.6.2更新）

2022-11-29 18:48:13 23339 3

原创目标检测论文解读复现 | 目录一览表

目标检测论文解读复现 | 目录一览表

2022-11-29 18:14:12 2928

原创学习经验分享【41】YOLOv13：基于超图增强自适应视觉感知的实时目标检测

提出了一种精确且轻量级的目标检测器 ——YOLOv13。为应对上述挑战，我们提出了基于超图的自适应关联增强（Hypergraph-based Adaptive Correlation Enhancement, HyperACE）机制，该机制通过超图计算自适应挖掘潜在高阶相关性，突破了以往方法仅基于成对关联建模的限制，实现了高效的全局跨位置和跨尺度特征融合与增强。

2025-07-01 20:30:14 366

原创 YOLOv12/11/10算法改进【NO.171】引入多认知视觉适配器

提出了多认知视觉适配器（Mona）调优，这是一种新颖的基于适配器的调优方法。首先，我们在适配器中引入了多个视觉友好型滤波器，以增强其处理视觉信号的能力，而以前的方法主要依赖于语言友好的线性滤波器。其次，我们在适配器中添加缩放的归一化层，以调节视觉过滤器的输入特征的分布。

2025-06-10 07:41:33 672

原创 YOLOv12/11/10算法改进【NO.170】引入轻量级视觉网络设计策略（CVPR2025 LSNet）

从高效人类视觉系统固有的动态异尺度视觉能力中汲取灵感，提出了一种 “See Large， Focus Small” 的轻量级视觉网络设计策略。我们介绍了 LS 卷积，它结合了大核感知和小核聚合。它可以有效地捕获广泛的感知信息，并针对动态和复杂的视觉表示实现精确的特征聚合，从而能够熟练地处理视觉信息。基于 LS 卷积，我们提出了 LSNet，这是一个新的轻量级模型系列。

2025-06-06 08:04:10 753

原创 YOLOv12/11/10算法改进【NO.169】引入具有线性复杂性的状态空间模型

TransMamba，这是一个新颖的框架，它通过共享参数矩阵（例如 QKV 和 CBx）统一了 Transformer 和 Mamba，因此可以在不同标记长度和层的注意力和 SSM 机制之间动态切换。我们设计了内存转换器，通过将注意力输出转换为 SSM 兼容状态来桥接 Transformer 和 Mamba，确保发生转换的 TransPoints 上的无缝信息流。

2025-06-05 21:54:11 503

原创 YOLOv12/11/10算法改进【NO.168】引入通过仅采用身份映射作为令牌混合器（TPAMI2024）

通过仅采用身份映射作为令牌混合器，称为 IdentityFormer 的 MetaFormer 模型在 ImageNet-1K 上实现了 >80% 的准确率。

2025-06-04 09:07:28 887

原创 YOLOv12/11/10算法改进【NO.167】引入高频信息的高频增强残差块（CVPR 2023）

与卷积结构相比，Transformer 结构更擅长捕获低频信息，但在构建高频表征方面能力有限。提出了交叉细化自适应特征调制 Transformer（CRAFT），该模型融合了卷积和 Transformer 结构的优势，包含三个核心组件：用于提取高频信息的高频增强残差块（HFERB）、捕获全局信息的移位矩形窗口注意力块（SRWAB），以及优化全局表征的混合融合块（HFB）。

2025-06-04 08:50:55 605

原创 YOLOv12/11/10算法改进【NO.166】引入了动态 tanh （DyT）（CVPR 2025）

引入了动态 tanh （DyT）。通过合并 DyT，没有归一化的 Transformer 可以达到或超过其归一化对应项的性能，大多数情况下无需超参数调整。

2025-06-03 14:58:36 1145

原创 YOLOv12/11/10算法改进【NO.165】引入一种简单而有效的视觉状态空间模型（EVSSM）用于图像去模糊，利用状态空间模型（SSM）对视觉数据的优势。（CVPR 2025）

提出了一种简单而有效的视觉状态空间模型（EVSSM）用于图像去模糊，利用状态空间模型（SSM）对视觉数据的优势。

2025-06-03 14:48:32 885

原创 YOLOv12/11/10算法改进【NO.164】引入一种用于多任务低光图像恢复的高效而强大的神经网络（CVPR-2025）

引入一种用于多任务低光图像恢复的高效而强大的神经网络。没有遵循当前基于 Transformer 的模型的趋势，而是提出了新的注意力机制来增强高效 CNN 的感受野。

2025-06-03 14:31:12 978

原创 YOLOv12/11/10算法改进【NO.163】引入高效视觉曼巴模型（EfficientViM）

引入高效视觉曼巴模型（EfficientViM）

2025-05-30 13:21:26 105

原创 YOLOv11/10/8算法改进【NO.162】引入用于医学图像分割的高效多尺度卷积注意力

跨领域创新，采用目标分割领域模块进行改进YOLO算法，进行创新。

2025-04-15 21:10:56 643 1

原创投稿指南【NO.12_16】【极易投中】期刊投稿（科学技术与工程）

期刊投稿（科学技术与工程）

2025-03-08 14:40:42 870

原创学习经验分享【39】YOLOv12——2025 年 2 月 19 日发布的以注意力为核心的实时目标检测器

提出了一个以注意力机制为核心的 YOLO 框架，即 YOLOv12，它在利用注意力机制性能优势的同时，能够达到与之前基于 CNN 的模型相当的速度

2025-02-22 16:08:58 1254

原创投稿指南【NO.12_15】【极易投中】期刊投稿（舰船电子工程）

期刊投稿（舰船电子工程）

2025-01-04 16:50:22 657

原创投稿指南【NO.12_14】【极易投中】期刊投稿（毛纺科技）

期刊投稿（毛纺科技）

2025-01-04 08:28:49 1128

原创 YOLOv11/10/8算法改进【NO.161】引入用于大感受野的小波卷积,改进C3k2模块

引入用于大感受野的小波卷积

2024-12-22 16:01:05 1040

原创 YOLOv11/10/8算法改进【NO.160】引入多分支辅助特征金字塔网络的多功能颈部的新型目标检测框架

路径聚合特征金字塔网络（PAFPN）在 YOLO 检测器中得到广泛应用。然而，它无法同时高效且自适应地整合高级语义信息与低级空间信息。在本文中，我们提出了一种名为 MAF - YOLO 的新模型，这是一种具有名为多分支辅助特征金字塔网络（MAFPN）的多功能颈部的新型目标检测框架。在 MAFPN 中，浅层辅助融合（SAF）模块旨在将骨干网络的输出与颈部相结合，保留最佳水平的浅层信息以促进后续学习。同时，深度嵌入颈部的高级辅助融合（AAF）模块向输出层传递更广泛多样的梯度信息。

2024-12-22 08:18:14 1101 1

原创 YOLOv11/10/8算法改进【NO.159】卷积加性自注意力视觉 Transformer，以在移动应用中实现效率和性能之间的平衡。

卷积加性自注意力视觉 Transformer，以在移动应用中实现效率和性能之间的平衡。引入了卷积加性自注意力（CAS）块混合架构，并在每个块中使用 CATM。

2024-12-19 21:31:18 119

原创 YOLOv11/10/8算法改进【NO.158】使用一种名为 PRepBN 的新方法，在训练过程中逐步用重新参数化的 BatchNorm 替代 LayerNorm

一种名为 PRepBN 的新方法，在训练过程中逐步用重新参数化的 BatchNorm 替代 LayerNorm。

2024-12-18 22:24:13 330

原创 YOLOv11/10/8算法改进【NO.157】引入MetaFormer

ConvFormer 优于 ConvNeXt。将常见的深度可分离卷积作为令牌混合器，名为 ConvFormer 的模型（可视为纯 CNN）优于强大的 CNN 模型 ConvNeXt。

2024-12-17 21:54:01 211

原创 YOLOv11/10/8算法改进【NO.156】使用基于廉价卷积算子的新型图像恢复网络

CNN 在图像恢复方面的潜力，并表明所提出的简单卷积网络架构（称为 ConvIR）的性能可以与 Transformer 同类架构相当或更好。通过重新审视高级图像恢复算法的特点，我们发现了导致恢复模型性能改进的几个关键因素。这促使我们开发一种基于廉价卷积算子的新型图像恢复网络。这促使我们开发一种基于廉价卷积算子的新型图像恢复网络。

2024-12-15 22:28:47 80

原创 YOLOv11/10/8算法改进【NO.154】引入内容自适应域转移模块

引入内容自适应域转移模块

2024-12-04 22:14:26 137

原创 YOLOv11/10/8算法改进【NO.153】引入用于图像超分辨率的高效长距离注意力网络

引入用于图像超分辨率的高效长距离注意力网络

2024-12-03 18:13:26 643

原创目标检测应用场景—数据集【NO.39】一个机场外来物碎片数据集

分享一个机场外来物碎片数据集

2024-12-03 13:59:56 1633

原创英文论文SCI 解读复现【NO.23】GFS-YOLO11: A Maturity Detection Model forMulti-Variety Tomato

GFS-YOLO11：多品种番茄成熟度检测模型

2024-11-17 22:11:43 901

原创 YOLOv11/10/8算法改进【NO.152】引入用于与 Transformer 进行多尺度通道交叉融合和一个子模块，用于引导融合的多尺度通道信息有效

一种CTrans 模块是 U-Net 跳跃连接的替代方案，它由一个子模块组成，用于与 Transformer 进行多尺度通道交叉融合（名为 CCT）和一个子模块 Channel-wise Cross-Attention（名为 CCA），用于引导融合的多尺度通道信息有效。

2024-10-27 20:30:21 261

原创 YOLOv11/10/8算法改进【NO.151】引入用于密集图像预测的频率感知特征融合

提出了频率感知特征融合（FreqFusion），集成了自适应低通滤波器（ALPF）发生器、偏移发生器和自适应高通滤波器（AHPF）发生器。ALPF 发生器预测空间变化的低通滤波器，以衰减对象内的高频分量，从而减少上采样期间的类内不一致。

2024-10-27 12:21:37 831

原创 YOLOv11/10/8算法改进【NO.150】引入用于医学图像分割的协同多注意力转换器

一种基于 Transformer 的高效架构，它融合了多种注意力机制，以增强小肿瘤和器官的分割。SMAFormer 可以捕获局部和全局特征以进行医学图像分割。该架构由两个关键组件组成

2024-10-27 12:18:30 925

原创 YOLOv11/10/8算法改进【NO.149】引入新的现代卷积网络系列——多阶门控聚合网络

近年来在多阶深度神经网络（DNN）中的博弈论交互揭示了现代卷积神经网络的感知瓶颈，其中富有表现力的交互具有没有随着内核大小的增加而进行有效编码。为了应对这一挑战——lenge，我们提出了一个新的现代卷积网络系列，称为 MogaNet

2024-10-27 12:15:23 769

原创 YOLOv11/10/8算法改进【NO.148】引入用于遥感图像语义分割的CNN 和多尺度 Transformer 融合网络

提出了一种新的编码器-解码器结构化语义分割网络，命名为 CNN 和多尺度变压器融合网络（CMTFNet），用于提取和融合高分辨率遥感图像的局部信息和多尺度全局上下文信息。

2024-10-27 12:11:45 336

原创 YOLOv11/10/8算法改进【NO.147】引入卷积加法自注意力视觉变压器实现高效的移动应用程序——一种新的加法模拟larity 函数

一种新的加法模拟larity 函数遵循此范式并呈现名为 Convolutional Additive Token 的 cient 实现混频器（CATM）。这种简化导致了显著的计算开销中的归纳。

2024-10-27 12:07:43 371

原创 YOLOv11/10/8算法改进【NO.146】引入具有简化线性注意和渐进的高效变压器重新参数化的批量归一化

变压器已成为基础架构自然语言和计算机sion 任务。然而，高计算成本使得在资源上部署变得相当具有挑战性 -约束设备。本文研究了高效的计算瓶颈模块transformer 的 Alpha 层，即归一化层和 atten-tion 模块。，提出了一种新的方法名为 PRepBN 以逐步替换Layer-Norm 与训练中重新参数化的 BatchNorm -正在。此外，我们提出了一种简化的线性注意（SLA）模块，简单而有效tive 实现强大的性能。

2024-10-27 10:17:43 873

原创 YOLOv11/10/8算法改进【NO.145】引入目标分割领域算法中的重新思考图像去雾网络思想

采用目标分割的算法改进思路来跨领域改进目标检测算法。

2024-10-27 10:11:28 1124

深度学习目标检测实时演示视频

2025-04-15

RSOD目标检测数据集

RSOD是一个开放的目标检测数据集，用于遥感图像中的目标检测。数据集包含飞机，油箱，运动场和立交桥，以PASCAL VOC数据集的格式进行标注。数据集包括4个文件夹，每个文件夹包含一种对象： 1.飞机数据集，446幅图像中的4993架飞机 2.操场，189副图像中的191个操场。 3.立交桥，176副图像中的180座立交桥。 4.油箱，165副图像中的1586个油箱。 ———————————————— 版权声明：本文为CSDN博主「陨星落云」的原创文章，遵循CC 4.0 BY-SA版权协议，转载请附上原文出处链接及本声明。原文链接：https://blog.csdn.net/qq_28368377/article/details/121464756

2023-01-05

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

深度学习目标检测实时演示视频

RSOD目标检测数据集

NWPU VHR-10（YOLO格式且已划分好数据集）

NEU-DET钢材表面缺陷数据集

用matlab画激活函数代码

融合CBAM通道注意力机制的YOLOv5-v6.1版本源码

.arch1109总种植图.bak

SAR遥感图像舰船数据集

空空如也