自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(815)
  • 收藏
  • 关注

原创 时间步位置编码生成函数

时间步位置编码生成函数(如)是为扩散模型核心设计的时间感知嵌入生成器。它在扩散过程中将连续的时间步信息转化为高维向量表示,使模型能够理解当前去噪阶段的位置信息,这是扩散模型能有效处理多步骤去噪过程的关键技术。

2025-07-23 21:54:03 397

原创 nn.Embedding

它在自然语言处理(NLP)、推荐系统等任务中广泛应用,特别是在处理分类数据或文本词汇时。模块的一个核心类,用于将离散的整数索引映射为连续的稠密向量(称为。是 PyTorch 中。[我, 爱, 学习]

2025-07-23 08:55:05 277

原创 Latent Diffusion(潜在扩散模型)

Latent Diffusion 通过将计算密集型操作转移到低维潜在空间,在保持生成质量的同时实现了效率的突破,已成为当前生成式AI的核心技术之一。而非原始像素空间进行扩散,显著降低了计算成本,同时保持了生成质量。,由 Rombach 等人在 2022 年提出。Latent Diffusion(LDM)是一种高效的。高分辨率图像 512x512x3。低维潜在空间 64x64x4。

2025-07-22 20:24:54 364

原创 GroupNorm

场景下传统批归一化(BatchNorm)效果不稳定的问题。通过这种设计,GroupNorm 在稳定训练过程的同时,保持了输入数据的独立性,使其成为小批量深度学习的优选归一化方案。是 PyTorch 提供的归一化层,用于解决。σ_g² ← 组内方差。每组独立计算均值和方差(沿。μ_g ← 组内均值。

2025-07-22 19:51:09 619

原创 UNet 架构

结合了残差网络、注意力机制和时间步嵌入,是当前最先进的扩散模型核心组件。噪声预测:估计添加到图像中的噪声多尺度特征提取:通过编码器-解码器结构捕获图像特征时间条件建模:将时间信息融入网络注意力机制:在不同分辨率上应用注意力条件生成支持:支持类别条件和空间条件。

2025-07-20 20:20:27 569

原创 PyTorch Lightning

统一模型定义与训练逻辑Trainer:自动化训练基础设施DataModule:标准化数据处理流程Callback:可扩展的训练过程定制这种设计使研究人员能够专注于模型创新而非工程细节,同时保证代码的生产就绪性。对于追求高效、可维护、可扩展的PyTorch开发者,Lightning已成为事实上的标准框架。

2025-07-20 14:46:05 538

原创 基于配置参数的动态函数调度

这行代码本质上是基于字符串的反射机制动态名称生成(f-string)全局符号表查询动态函数调用实现了配置驱动的组件初始化,是深度学习框架中常见的插件化设计模式,兼顾了灵活性和扩展性。

2025-07-19 19:37:33 827

原创 在 Ubuntu 中格式化 U 盘

因为本人的U盘在windows系统下进行格式化时,一直显示U盘被写入保护中,无法格式化。没办法,只能在Ubuntu下格式化了。

2025-07-19 11:30:39 500

原创 vscode无法使用tab键

在 VSCode 遇到 Tab 键失效的问题,通常是由于或。

2025-07-16 13:37:20 308

原创 在 macOS 的“自动操作”中创建一个应用程序来运行 `killall Dock` 命令

此blog创建的原因在于,我的dock一旦卡死,我输入的文字就会变成其他操作(如另存、左右移动等),导致我无法输入。因此我决定创建一个重启dock的.app自动程序,这样一旦mac卡死,就可以通过双击来重启dock,而不需要命令行输入killall Dock(因为我的dock一旦卡死,便输入不了文字)。

2025-07-13 10:36:41 322

原创 Center Crop Evaluation(中心裁剪评估) 和 Raw Evaluation(原始评估/全图评估)

在评估时,将测试图像严格居中裁剪出一个预设大小(如 84x84 或 224x224)的正方形区域。隐含地假设目标物体位于图像的中心区域。移除了图像边缘的大部分区域,可能包含背景、干扰物或目标物体的非核心部分。主要评估模型对居中目标物体核心部分的识别能力。在评估时,将整个原始测试图像直接缩放(Resize)到模型输入所需的大小(如 84x84 或 224x224)。对目标物体在图像中的位置没有假设。物体可能位于中心,也可能偏于一侧或一角。

2025-07-09 08:37:58 446

原创 GDN(Generalized Divisive Normalization,广义除法归一化)

通道交互机制:通过gamma矩阵实现跨通道调节安全约束LowerBound确保参数>0beta_min防止数值溢出重参数化技巧存储sqrt(参数+offset)保证训练稳定性前向传播时还原为原始参数维度兼容:智能处理2D/3D输入数据计算优化:用卷积操作高效实现通道加权求和该层主要用于图像压缩神经网络(如JPEG AI),通过对特征图的归一化处理,增强关键特征并抑制噪声,提升压缩效率。

2025-07-08 16:53:20 822

原创 GDN (Generalized Divisive Normalization) 、 PReLU (Parametric Rectified Linear Unit)

推荐在通用深度学习网络设计中使用,尤其适用于大规模、深层次的神经网络,可以减少死神经元现象,提升网络训练稳定性和泛化性能。推荐在图像压缩、信号处理、图像特征提取任务中使用,它能有效降低数据冗余性,提升压缩率和重构质量。

2025-07-08 16:29:58 768

原创 GPT-4o、o3、o4-mini、o4-mini-high、GPT-4.5、GPT-4.1、GPT-4.1-mini

✅✅✅✅“o3”应该是“GPT-3.5”的打字或命名变体,因为没有官方叫“GPT-o3”的模型。✅属于一些OpenAI API或内部环境中出现的模型标识,不是ChatGPT产品官方公开命名。

2025-07-06 17:13:36 812

原创 可分离4D卷积

高维分解:将4D卷积分解为两个3D卷积操作空间分离:独立处理高度/宽度和深度维度通道投影:灵活调整输出通道维度优化计算:大幅降低4D卷积的计算复杂度维保特持:保持输入空间结构不变。

2025-07-02 22:46:30 640

原创 交叉相关增强模块(CCA)

相关图优化:通过卷积层增强相关图中的显著模式对称处理:双向处理支持-查询关系高效计算:使用可分离卷积降低计算复杂度非线性增强:ReLU激活引入非线性建模能力双向对称处理:同时考虑原始和转置相关图参数共享:相同卷积处理两个路径轻量设计:可分离卷积大幅降低计算量端到端优化:可集成到任何相关图处理流程通用架构:支持不同深度和宽度的扩展。

2025-07-02 16:35:39 806

原创 CCALayer(交叉相关注意力层)

4D相关图建模:计算支持集与查询集的像素级关系交叉相关增强:使用CCA模块优化相关图双向注意力机制:分别从支持集和查询集角度生成注意力特征加权与聚合:生成类别感知的特征表示相似度矩阵计算:输出类别级相似度用于分类4D相关图:首次在小样本学习中建模像素级支持-查询关系双向注意力:同时考虑支持→查询和查询→支持视角特征精炼:注意力加权提炼最相关特征区域温度分离:独立控制相似度和注意力分布端到端优化:整个系统可训练,无人工设计组件。

2025-07-02 16:27:26 869

原创 SCR(自相关表示)模块

自相关特征精炼:在邻域维度上提炼特征关系维度智能转换:在空间维度和邻域维度间灵活切换特征压缩与恢复:通过瓶颈层提升计算效率关系建模:捕捉空间位置与邻域的重要关联。

2025-07-02 15:46:49 895

原创 小样本学习算法

(关系模块),直接预测查询样本与类原型的相似度得分,而非使用固定距离函数。支撑集 Support Set。查询集 Query Set。"概念,将每个类别表示为。提取特征f_φ(x_i)嵌入函数f_φ提取特征。计算类原型向量c_k。计算与各类原型的距离。

2025-07-02 15:33:26 683

原创 自相关表示层(SCRLayer)

SCRLayer(Self-Correlation Representation Layer)用于增强特征的空间上下文关系表示。自相关计算:通过滑动窗口计算特征图的内部空间关系特征增强:通过神经网络转换增强自相关信息维度保持:输入输出维度一致,便于嵌入网络。

2025-07-02 15:13:30 986

原创 RENet

处理4D相关张量(支持集和查询集的空间关系):将4D卷积分解为两个3D卷积(空间+通道):建模支持集-查询集关系并生成相似度矩阵。:利用全局数据提升特征表示泛化能力。:增强特征的空间上下文表示能力。:建模像素级支持集-查询集关系。:简单特征比较忽略细粒度关系。表示每个位置与邻域的关系。:传统特征缺乏空间关系建模。:计算特征图的自相关矩阵。:高效处理4D相关张量。:增强特征的自相关表示。SepConv4d层。SepConv4d层。:小样本任务数据不足。

2025-07-02 14:04:25 641

原创 小样本学习算法

这三种算法构成了小样本学习的核心方法论体系,各有侧重解决不同场景下的少样本学习问题。原型网络因其简洁有效成为入门基线,关系网络通过可学习的相似度度量提升性能上限,R2D2则在理论框架上实现突破,通过双层优化实现闭式解分类。(关系模块),直接预测查询样本与类原型的相似度得分,而非使用固定距离函数。支撑集 Support Set。查询集 Query Set。"概念,将每个类别表示为。提取特征f_φ(x_i)嵌入函数f_φ提取特征。计算类原型向量c_k。计算与各类原型的距离。

2025-07-02 13:42:41 1144

原创 滑动窗口展开操作

nn.Unfold局部特征提取:在特征图上滑动窗口提取局部块数据重组:将空间信息转换为通道维度高效实现:提供卷积操作的底层实现基础维度转换:为自相关计算准备数据结构。

2025-07-02 13:36:08 728

原创 mac常用快捷键,Mac文件重命名快捷键,Mac OS快速访问系统根目录

command+r 相当于F5,刷新页面command+q 关闭当前程序在Finder中command+/ 打开底部状态栏,可以查看剩余磁盘空间大小sudo mdutil -a -i off关闭spotlight的mdworkder,这个经常会疯狂占用系统cpu内存占用超过75%的时候,执行一下purge,可以释放disk cache从 finder 工具栏删除图标:按住c..._苹果command+r键相当于。

2025-06-28 13:55:49 352

原创 Mac顶部菜单栏(Menubar)卡死

升级了Mojave后,Mac pro 2015 early 顶部菜单栏经常卡死。重启菜单栏(Menubar)笔者接下来分享两种常见的重启菜单栏的方法。方法一:使用活动监视器打开 OS X 预置的「活动监视器」应用程序,选择「内存」选项卡,在右上角搜索框内键入SystemUIServer关键字,选中结果中的SystemUIServer进程。接着点击窗口左上角的「X」按钮,..._macmini顶部菜单栏点不动。Mac顶部菜单栏(Menubar)卡死_macmini顶部菜单栏点不动-CSDN博客。

2025-06-27 09:26:43 253

原创 [“EuroSAT“, “ISIC“, “ChestX“, “CropDisease“]数据集

这些数据集均为计算机视觉领域重要基准,常用于深度学习模型(特别是迁移学习)的评估。:医学影像(胸部X光诊断):医学影像(皮肤病诊断)

2025-06-26 11:02:43 772

原创 EuroSAT 数据集

EuroSAT 是一个精心构建的、基于 Sentinel-2 卫星影像的欧洲土地利用/覆盖分类数据集。它以 10 个平衡的类别、27,000 张 64x64 像素的图像(提供 RGB 和多光谱版本)、10米空间分辨率以及高质量和开放获取的特性,成为遥感图像分类领域不可或缺的标准基准数据集。它极大地推动了深度学习在遥感中的应用,适用于算法研究、模型评估和迁移学习。虽然存在地域限制和类别粒度等局限性,但其优势使其在学术界和工业界都备受青睐。

2025-06-26 10:39:05 923

原创 远程链接Bug解决|VScode连接远程服务器时一直要求输入密码

(72 封私信 / 80 条消息) 远程链接Bug解决|VScode连接远程服务器时一直要求输入密码 - 知乎。个人实践认为,卸载重装vscode最简单省事。

2025-06-19 08:53:31 164

原创 英文邮件中的“暗语”缩写:TBD、TBC、EOD、都是什么意思?

英文邮件中的“暗语”缩写:TBD、TBC、EOD、都是什么意思?

2025-06-18 18:40:49 162

原创 深度主动学习(Deep Active Learning)和宽学习系统(Broad Learning System)

传统深度学习依赖大量标注数据,而主动学习通过策略性选择“信息量最大”的样本交给专家标注,最大化模型学习效率。,适用于资源受限的动态场景(如边缘计算中的实时决策)。的样本标注,例如预测概率接近0.5的样本。训练多个模型组成“委员会”,选择委员会。的样本(如梯度变化最大)。当新增数据或节点时,通过。选择信息量最大的样本。

2025-06-18 17:22:12 849

原创 5-way 1-shot等指标

5-way 1-shot”、“5-way 5-shot”、“5-way 20-shot”、“5-way 50-shot”等指标和它们所代表的实验设置术语是小样本学习(Few-Shot Learning, FSL)领域,特别是其子领域跨域小样本学习(Cross-Domain Few-Shot Learning, CDFSL)中的。通过在这四种设置下比较准确率,可以全面评估CDFSL方法在极端少样本到低样本场景下的鲁棒性、泛化能力和跨域适应性。FSL 的评估通常在一个包含大量目标域类别(例如数百个)的。

2025-06-18 16:04:32 555

原创 mac自动登录,无需输入密码

之所以设置自动登录,是因为不登录mac就无法自动登录启动第三方软件,影响我使用mac作为私有云来使用。macOS苹果电脑取消开机输入的密码,自动开机登录进入系统 - 黑苹果屋。

2025-06-17 23:09:15 314

原创 mac和windows互传文件

如何将 Windows 上的文件传递到 Mac 上_怎么把windows电脑上的文件传到mac-CSDN博客。(72 封私信 / 80 条消息) Windows的文件怎样弄到MacBook去?

2025-06-16 12:51:42 204

原创 自动开关机软件哪个好?自动开关机软件盘点

自动开关机软件哪个好?自动开关机软件盘点-CSDN博客。

2025-06-11 18:17:29 387

原创 VMware虚拟机和主机间复制粘贴共享剪贴板、共享文件夹

电脑主机与VMware虚拟机共享文件详细教程_vmware 打开共享文件夹-CSDN博客。VMware虚拟机和主机间复制粘贴共享剪贴板 - 知乎。

2025-06-08 08:54:13 455

原创 sudo vim /etc/apt/sources.list;deb http://mirrors.ustc.edu.cn/ubuntu/

词源:希腊语 xenia (ξενοσ),意为"友好待客之道"指轻松完成的任务(如"jammy dodger"饼干)表达系统运行如"涂了果酱般顺滑"词源:英式俚语,意为"幸运的"问题:sudo apt-get update连接失败 错误:1 http://cn.mirrors.ustc.edu.cn/ubuntu bionic InRelease 连接失败 [IP: 218.104.71.170 80]命中:2 http://security.ubuntu.com/ubun。

2025-06-07 18:57:12 1071

原创 Ubuntu 版本与代号对应关系及命名解析

版本不匹配时(如 Xenial 源用在 Jammy 系统),会导致包依赖解析错误(APT 报错 404 或 Hash 校验失败)"(太走运了),幽默表达新版优化的惊喜。呼应 Ubuntu 哲学"人道待人"(Ubuntu 祖鲁语意为"仁爱")动物选取兼顾知名度(Lynx)和独特性(Xerus),彰显文化包容性。词源:希腊语 xenia (ξενοσ),意为"友好待客之道"指轻松完成的任务(如"jammy dodger"饼干)表达系统运行如"涂了果酱般顺滑"词源:英式俚语,意为"幸运的"

2025-06-07 18:56:43 945

原创 执行sudo apt-get update,连接失败;连接ppa.launchpadcontent.net失败

问题:sudo apt-get update连接失败 错误:1 http://cn.mirrors.ustc.edu.cn/ubuntu bionic InRelease 连接失败 [IP: 218.104.71.170 80]命中:2 http://security.ubuntu.com/ubun。执行sudo apt-get update,连接失败 - 捷后愚生 - 博客园。

2025-06-07 17:23:26 155

原创 Ubuntu下配置OpenCL环境

在Ubuntu下配置OpenCL环境不一定需要独立显卡。OpenCL可以在多种设备上运行,包括:CPU(几乎所有现代CPU都支持OpenCL)集成显卡(如Intel UHD Graphics、AMD Radeon Vega等)独立显卡(NVIDIA/AMD)FPGA和其他加速器。

2025-06-07 17:05:20 375

原创 无法发起与 ppa.launchpadcontent.net:443 (2620:2d:4000:1::81) 的连接 - connect (101: 网络不可达) 无法连接上 ppa.launchp

ubuntu apt-get 不能连接 ppa.launchpad.net 的问题_ppa launchpad。Linux下不能连接ppa.launchpad.net的问题(中科大软件源)_ppa launchpad-CSDN博客。

2025-06-07 15:15:36 404

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除