自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

周同学的博客

Python/C++/Linux学习记录,专注于做杜老师的搬运工

  • 博客(241)
  • 收藏
  • 关注

原创 周同学文章汇总

博主文章汇总

2024-01-21 17:15:29 7544 9

原创 【CUDA进阶】Tensor Core实战教程(下)

【CUDA进阶】Tensor Core实战教程(下)

2025-07-20 11:32:02 468

原创 【CUDA进阶】Tensor Core实战教程(上)

【CUDA进阶】Tensor Core实战教程(上)

2025-07-20 11:29:55 589

原创 A2A协议深度解析 - 第 2 部分:流式返回 + 多Agent场景

A2A协议深度解析 - 第 2 部分:流式返回 + 多Agent场景

2025-07-06 14:59:08 1017

原创 A2A协议深度解析 - 第 1 部分:双Agent同步调用场景

A2A协议深度解析 - 第 1 部分:双Agent同步调用场景

2025-07-06 14:58:25 999 2

原创 【CUDA调优指南】缓存&访存流程

【CUDA调优指南】缓存&访存流程

2025-06-25 21:44:42 1084

原创 【CUDA调优指南】合并访存

【CUDA调优指南】合并访存

2025-06-25 21:44:12 1075

原创 MCP 与 Function Calling 的关系

MCP 与 Function Calling 的关系

2025-06-16 21:30:33 725

原创 MCP终极指南 - 番外篇:抓包分析 Cline 与模型的交互协议

MCP终极指南 - 番外篇:抓包分析 Cline 与模型的交互协议

2025-06-16 21:29:32 1203

原创 MCP终极指南 - 带你深入掌握MCP(进阶篇)

MCP终极指南 - 带你深入掌握MCP(进阶篇)

2025-06-08 20:43:24 927

原创 MCP终极指南 - 从原理到实战,带你深入掌握MCP(基础篇)

MCP终极指南 - 从原理到实战,带你深入掌握MCP(基础篇)

2025-06-08 20:40:26 1461 4

原创 【CUDA】Sgemm单精度矩阵乘法(下)

【CUDA】Sgemm单精度矩阵乘法(下)

2025-05-14 21:43:50 1061 3

原创 【CUDA】Sgemm单精度矩阵乘法(上)

【CUDA】Sgemm单精度矩阵乘法(上)

2025-05-14 21:43:01 1284 2

原创 GGML源码逐行调试(下)

GGML源码逐行调试(下)

2025-04-12 22:55:31 1014

原创 GGML源码逐行调试(中)

GGML源码逐行调试(中)

2025-04-12 22:54:46 1053

原创 GGML源码逐行调试(上)

GGML源码逐行调试(上)

2025-04-12 22:45:51 1698

原创 LLM中的KV Cache优化技术

LLM中的KV Cache优化技术

2025-03-30 22:02:34 1536

原创 理解llama.cpp如何进行LLM推理

理解llama.cpp如何进行LLM推理

2025-03-30 22:01:58 1689 1

原创 Transformers&InternLM源码阅读

Transformers&InternLM源码阅读

2025-03-23 09:03:10 792

原创 Flash Attention代码实现

Flash Attention代码实现

2025-03-23 09:02:54 1524 2

原创 Flash Attention原理讲解

Flash Attention原理讲解

2025-03-16 22:20:35 1636

原创 从Online Softmax到FlashAttention

从Online Softmax到FlashAttention

2025-03-16 22:14:51 893

原创 【CUDA】Reduce归约求和(下)

【CUDA】Reduce归约求和(下)

2025-03-08 16:11:34 949

原创 【CUDA】Reduce归约求和(上)

【CUDA】Reduce归约求和(上)

2025-03-08 16:11:02 1092 1

原创 DeepSeek MLA(Multi-Head Latent Attention)代码实现

DeepSeek MLA(Multi-Head Latent Attention)代码实现

2025-03-02 22:17:27 1516

原创 DeepSeek MLA(Multi-Head Latent Attention)算法浅析

DeepSeek MLA(Multi-Head Latent Attention)算法浅析

2025-03-02 22:16:25 1422

原创 从矩阵乘法探秘Transformer

从矩阵乘法探秘Transformer

2025-03-02 22:14:56 847

原创 RoPE旋转位置编码代码实现

RoPE旋转位置编码代码实现

2025-02-23 12:08:24 1405

原创 RoPE旋转位置编码原理浅析

RoPE旋转位置编码原理浅析

2025-02-23 12:07:36 1283

原创 Positional Encoding位置编码浅析

Positional Encoding位置编码浅析

2025-02-23 12:07:10 1294

原创 YOLOv12推理详解及部署实现

YOLOv12推理详解及部署实现

2025-02-19 21:31:49 5664 23

原创 RMSNorm算子的CUDA实现

RMSNorm算子的CUDA实现

2025-02-19 21:30:38 1280 2

原创 KV Cache的原理与实现

KV Cache的原理与实现

2024-12-31 21:15:26 1387 7

原创 Depth-Anything推理详解及部署实现(下)

Depth-Anything推理详解及部署实现(下)

2024-12-14 20:17:16 3364

原创 Depth-Anything推理详解及部署实现(上)

Depth-Anything推理详解及部署实现(上)

2024-12-14 20:07:03 6790 8

原创 CUDA与TensorRT部署实战课程:课程总结

CUDA与TensorRT部署实战课程:课程总结

2024-11-11 23:40:56 2652 9

原创 八. 实战:CUDA-BEVFusion部署分析-forward

八. 实战:CUDA-BEVFusion部署分析-forward

2024-11-11 23:40:32 1859

原创 直观解释大语言模型如何储存事实 | Chapter 7 | Deep Learning | 3Blue1Brown

直观解释大语言模型如何储存事实 | Chapter 7 | Deep Learning | 3Blue1Brown

2024-10-26 11:33:39 1353

原创 直观解释注意力机制,Transformer的核心 | Chapter 6 | Deep Learning | 3Blue1Brown

直观解释注意力机制,Transformer的核心 | Chapter 6 | Deep Learning | 3Blue1Brown

2024-10-26 11:32:22 1312

原创 GPT是什么?直观解释Transformer | Chapter 5 | Deep Learning | 3Blue1Brown

GPT是什么?直观解释Transformer | Chapter 5 | Deep Learning | 3Blue1Brown

2024-10-25 19:25:45 1601

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除