自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(1405)
  • 收藏
  • 关注

原创 大语言模型加速技术之KV Cache

大语言模型加速技术之KV Cache

2025-07-24 09:52:05 743

原创 MoCo 论文解读

MoCo 论文解读

2025-07-17 10:34:18 275

原创 从零构建深度学习框架(二):自动反向传播与计算图进阶

🧮 从零构建深度学习框架(二):自动反向传播与计算图进阶

2025-07-02 11:05:37 805

原创 从零构建深度学习框架(一):计算图与自动微分的起

🚀 从零构建深度学习框架(一):计算图与自动微分的起点

2025-07-01 21:24:19 606

原创 通俗易懂解读BPE分词算法实现

通俗易懂解读BPE分词算法实现

2025-06-25 22:30:38 910

原创 通俗易懂讲解LoRA微调

通俗易懂讲解LoRA微调

2025-06-18 17:01:16 861

原创 LASO: Language-guided Affordance Segmentation on 3D Object 论文代码解读与复现

LASO论文提出了一种语言引导的3D对象功能区域分割任务及配套数据集。该数据集基于3D-AffordanceNet构建,包含19,751个点云-问题配对,涵盖23类物体和17种功能类型。研究团队手工设计了58种物体-功能组合的870个问题,并通过GPT-4扩展增强问题多样性。数据集采用seen/unseen两种评估模式,测试模型对新组合的泛化能力。代码实现中,数据集初始化通过建立物体类别和功能类型的索引映射关系,并加载标注数据与点云信息。这项工作为语言引导的3D功能分割研究提供了标准化评估基准。

2025-06-17 15:16:53 449

原创 conda虚拟环境管理

本文总结了Conda环境管理的常用命令:创建新环境(可指定Python版本和安装包)、激活/退出环境、查看/删除环境列表、查看已安装包以及环境下的包安装方法。特别对比了pip与conda的差异:conda能处理非Python依赖并提供预编译包。最后提供了常见错误"CondaError"的解决方案。这些命令涵盖从环境创建到维护的全流程,帮助用户高效管理Python开发环境。注意使用pip安装时要先激活目标环境,避免包安装到错误位置。

2025-06-14 12:00:52 600

原创 语义分割中常用的损失函数

本文介绍了语义分割任务中常用的损失函数,重点分析了Dice Loss和BCE-Dice Loss的原理、特点及实现。Dice Loss基于Dice系数,对类别不平衡不敏感,适合小目标分割;BCE-Dice Loss结合了二元交叉熵(关注逐点分类)和Dice Loss(关注区域匹配)的优势,既能提升边缘识别精度,又能缓解类别不平衡问题。文章还提供了两种损失函数的PyTorch实现代码,包括平滑项处理等细节。这两种损失函数在医学图像分割等存在严重类别不平衡的场景中表现优异。

2025-06-14 11:58:48 664

原创 庖丁解牛BLIP2

BLIP-2论文提出了一种高效的多模态预训练方法,通过两阶段训练策略降低计算成本。核心创新是Q-Former模块,它在冻结的视觉编码器和语言模型之间建立桥梁。第一阶段使用图像-文本对比学习、基于图像的文本生成和图文匹配三种损失训练Q-Former;第二阶段将学习到的视觉特征适配到冻结的LLM。这种方法显著减少了训练开销(比现有方法节省15倍资源),同时保持了强大的zero-shot生成和视觉推理能力。代码已开源在LAVIS项目中,为多模态研究提供了高效解决方案。

2025-06-01 16:34:28 961

原创 简析PointNet++

PointNet++网络概述 PointNet++是对PointNet的改进,主要解决了局部特征学习问题。网络通过层次化结构处理点云数据,包含采样层、分组层和PointNet层三个核心组件:1)采样层使用最远点采样选择中心点;2)分组层通过球查询构建局部区域;3)PointNet层对局部区域进行特征编码。这种架构能够更好地捕捉局部上下文信息,同时保持对点云无序性和几何变换的鲁棒性。网络通过递归应用这些层次化操作,逐步抽象点云特征,最终实现对点云数据的分类或分割任务。

2025-06-01 16:18:48 1079

原创 简析PointNet

PointNet是首个直接处理点云数据的深度学习方法。针对点云的无序性、点间关系、几何变换不变性及噪声问题,PointNet创新性地采用对称函数(max pooling)实现顺序不变性,通过T-Net网络实现几何变换鲁棒性,并结合局部与全局特征融合机制。理论证明其仅依赖关键点集,对缺失和噪声具有强鲁棒性。实验显示,即使50%点缺失,分类准确率仅下降3.7%。该架构奠定了三维深度学习的基石,为点云分类、分割等任务提供了统一解决方案。

2025-05-28 15:33:52 615

原创 图解BERT

图解Bert & Bert文本分类实战

2025-05-25 10:43:59 1161 1

翻译 文本引导的 3D 视觉定位综述

文本引导的 3D 视觉定位综述

2025-04-22 16:14:16 135

原创 各类卷积的计算过程图解

各类卷积的计算过程图解

2025-04-07 10:09:25 627

翻译 Promt 提示词工程发展史的简单梳理

Promt 提示词工程发展史的简单梳理

2025-02-22 10:51:22 432

原创 RNN中远距离时间步梯度消失问题及解决办法

图解RNN中的梯度消失与爆炸问题

2025-02-21 22:04:33 1062

原创 大模型(LLM)解码方法简单梳理

大模型(LLM)解码方法简单梳理

2025-02-21 14:39:37 1024

原创 多模态模型CLIP原理与图片分类,文字搜索图像实战演练

多模态模型CLIP原理与图片分类,文字搜索图像实战演练

2025-02-19 16:30:21 2226

原创 ResNet 为什么能解决网络退化问题?通过图片分类案例进行验证

ResNet 为什么能解决网络退化问题?通过图片分类案例进行验证

2025-02-17 16:01:14 1333

原创 图片分类实战 -- 分别基于NiN,GoogLeNet进行实现

图片分类实战 -- 分别基于NiN,GoogLeNet进行实现

2025-02-17 13:01:47 651

原创 图片分类实战 -- 分别基于LeNet,AlexNet,VGG进行实现

图片分类实战 -- 分别基于LeNet,AlexNet,VGG进行实现

2025-02-16 23:49:30 426

原创 花卉图片分类实战 -- 基于预训练的 Vision Transformer 实现

花卉图片分类实战 -- 基于预训练的 Vision Transformer 实现

2025-02-15 10:51:32 785

原创 生成式聊天机器人 -- 基于Transformer实现的SeqToSeq模型 -- 上

生成式聊天机器人 -- 基于Transformer实现的SeqToSeq模型 -- 上

2025-02-13 16:03:37 878 1

原创 演进历史: Seq2Seq 到 Transformer

演进历史: Seq2Seq 到 Transformer

2025-02-12 16:25:57 1148

原创 自注意力机制 与 多头注意力机制 代码实现与图解

自注意力机制 与 多头注意力机制 代码实现与图解

2025-02-11 18:27:05 1235

原创 生成式聊天机器人 -- 基于Pytorch + Global Attention + 双向 GRU 实现的SeqToSeq模型 -- 下

生成式聊天机器人 -- 基于Pytorch + Global Attention + 双向 GRU 实现的SeqToSeq模型 -- 下

2025-02-09 23:39:20 1282

原创 生成式聊天机器人 -- 基于Pytorch + Global Attention + 双向 GRU 实现的SeqToSeq模型 -- 上

生成式聊天机器人 -- 基于Pytorch + Global Attention + 双向 GRU 实现的SeqToSeq模型 -- 上

2025-02-09 19:22:17 1293

原创 GRU 和 LSTM 公式推导与矩阵变换过程图解

GRU 和 LSTM 公式推导与矩阵变换过程图解

2025-02-08 16:17:33 931

原创 单向/双向,单层/多层RNN输入输出维度问题

单向/双向,单层/多层RNN输入输出维度问题一次性解决

2025-02-08 13:34:36 1328

转载 Transformer详解和形象化解释

Transformer详解和形象化解释

2025-02-02 20:26:07 129

转载 卷积神经网络最清晰的理解 -- 下

卷积神经网络最清晰的理解 -- 下

2025-01-25 12:59:18 80

转载 卷积神经网络最清晰的理解 --上

卷积神经网络最清晰的理解 --上

2025-01-24 16:18:32 166

转载 基于 Neural Style Transfer 论文 实现的图像风格迁移

基于 Neural Style Transfer 论文 实现的图像风格迁移

2025-01-24 12:30:01 196 1

原创 PyTorch 深度学习框架快速入门 (小土堆)

PyTorch 深度学习框架快速入门 (小土堆)

2025-01-13 17:12:07 747

原创 那些年听烂了的名词之“高可用“

那些年听烂了的名词之“高可用“

2024-01-22 17:03:50 1378 2

原创 自己动手造一个状态机

大厂常用的状态机实现,还不赶紧学起来!

2024-01-22 17:03:28 1924

转载 GraphQL及元数据驱动架构在后端BFF中的实践

GraphQL及元数据驱动架构在后端BFF中的实践

2024-01-11 13:36:49 596

转载 GraphQL 在闲鱼数据聚合上的探索和实践

高效研发-闲鱼在数据聚合上的探索与实践

2024-01-11 00:21:59 448

原创 字节开源的netPoll多路复用器源码解析

字节开源的netPoll多路复用器源码解析

2023-12-17 15:55:38 1257

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除