自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

烟云的计算

若抽象才是美之定义,追求明确性的我们是否象征着丑陋。

  • 博客(1664)
  • 资源 (3)
  • 问答 (2)
  • 收藏
  • 关注

原创 AWS 云技术专栏系列文章

目录文章目录目录AWSAWS《2021 亚马逊云科技中国峰会,对话 “容器混合云会是未来的答案吗?”》《无处不在的 AWS 云计算》《全面解读 AWS Private 5G 的革新理念》《AWS — 重塑混合云》《AWS — VPN 虚拟专用云》《AWS — AWS Local Zone》《AWS — AWS Wavelength》《AWS — AWS Outposts》《AWS — AWS Direct Connect》《AWS — AWS EC2》《AWS — AWS ECS》

2022-04-05 17:34:25 4898 2

原创 软硬件融合加速技术系列文章

目录文章目录目录计算机组成原理Linux 操作系统原理处理器进程管理内存管理I/O 系统文件系统网络协议栈资源管理设备管理GPUFPGASmartNIC/DPU计算机组成原理《计算机组成原理 — 冯诺依曼体系结构》《计算机组成原理 — 基本硬件设备》《计算机组成原理 — CPU 中央处理器》《计算机组成原理 — 指令系统》《计算机组成原理 — 总线系统》《计算机组成原理 — 存储系统》《计算机组成原理 — 输入输出系统 — 存储控制器接口类型》《计算机组成原理 — 服务器》《计算机组成

2022-04-02 19:09:18 5425

原创 架构师之路系列文章

目录文章目录目录软件架构API 经济系统架构分布式系统分布式消息队列分布式任务队列高可靠要求高性能要求安全要求软件架构API 经济《架构师之路 — API 经济 — API 实现方式》《架构师之路 — API 经济 — RESTful API 设计规范》《架构师之路 — API 经济 — Web、HTTP Server、API Service、Application》《架构师之路 — API 经济 — Swagger & OpenAPI Specification》系统架构分布式系

2022-02-05 15:26:52 3783 4

原创 云计算与云原生技术系列文章

目录文章目录目录OpenStack IaaSKubernetes CaaSOpenShift PaaS云计算行业剖析云计算发展预测OpenStack IaaSKubernetes CaaSOpenShift PaaS云计算行业剖析云计算发展预测

2021-08-04 15:14:30 5067 6

原创 云网融合与算力网络系列文章

目录文章目录目录OvSDPDKVPPNeutronOvS《OpenFlow Switch 1.3 规范》《OpenvSwitch 架构解析与功能实践》《基于 Open vSwitch 的 OpenFlow 实践》DPDK《用户态网络协议栈还是内核协议栈?》《DPDK — 数据平面开发技术》《DPDK — 数据平台优化技术》《DPDK — 架构解析》《DPDK — 安装部署》《DPDK — PMD,DPDK 的核心优化》《DPDK — IGB_UIO,与 UIO Framework

2021-02-28 13:43:12 7738 7

原创 5G + 边缘计算系列文章

目录文章目录目录5GUENRNGCUE + NR + NGC边缘计算ETSI云边缘云网融合云边协同分布式云算力网络边缘原生OpenNESSKubeEdgeOpenYurtOthers5G《5G — 3 大场景、8 大 KPI》《5G 3GPP 标准》《5GC 关键技术 5G 专网》《5GC 关键技术之网络切片》《5GC 关键技术之本地分流》《5G 网络关键流程解读》UE《5G 需要换 SIM 卡吗?》NRNGC《5G NGC 系统架构》《5G 核心网的 UPF(User Plan

2020-12-26 01:21:27 12438 12

原创 GPU/CUDA 发展编年史:GPGPU 芯片架构和 CUDA 软件架构(中)

区别于 SIMD,SIMT 的每个 SM 都有独立的 Branch(分支)能力,每个 Thread 都有自己独立的指令地址和寄存器状态,这意味着每个 Thread 会使用各自的 Data 执行指令分支,使得 Threads 的编程更加灵活。H100 相对于 A100 有了质的飞跃。Kepler 的架构设计思路是减少 SM 单元数(在这一代中叫 SMX 单元),增加每组 SM 单元中的 CUDA core 数,每个 SM 单元的 CUDA core 数由 Fermi 架构的 32 个增至 192 个。

2025-07-12 01:24:38 1294

原创 常用 AI 工具集

2025-07-07 11:06:57 165

原创 程序性能分析器实现技术

PyEval_SetProfile 的本质是 Python 解析器 CPython 对外提供的一个接口函数,用于注册一个全局的性能分析(profiling)回调函数,然后监控 Python 代码的执行事件,如 PyTrace_CALL(函数调用)或 PyTrace_RETURN(函数返回)。混合方案:pyspy(采样) + cProfile(追踪) ,先用采样定位热点模块,再用追踪深入分析特定函数。代表工具:Python 的 cProfile、profile,Java 的 JProfiler(追踪模式)。

2025-06-16 17:53:20 898

原创 Cursor 编程实践 — 开发环境部署

为了更方便地向 LLM 提供上下文信息,Cursor 内设了 @ 注记符,使用 @ Add Context 注记符能够方便地注入对应的上下文信息到 Chat 对话框中。Cursor IDE 是 VS Code 的一个分支,所以如果你已经在本地使用了 VS Code,那么可以直接导入 vscode 配置到 Cursor IDE 使用。例如:我现在有关于银行客户的数据样例,主要想做“银行信用:对银行客户的评分判别”分析,请帮我生成 python 代码并且分析。开箱即用:建议选择中文,方便打造个人习惯配置。

2025-06-11 18:48:13 1388

原创 AI Agent 与 Agentic AI 企业实践

标注过程中还需建立严格的质量控制机制,包括随机抽检、交叉验证和专家评审等多重保障措施,确保数据质量达到行业应用标准。高质量的标注数据不仅提升了Agent的专业表现,也为后续的模型微调提供了可靠基础。数据工程实施:核心在于构建高质量的专业知识库。知识库构建流程始于全面的原始数据采集,需综合考虑公开文献、行业标准和企业内部资料等多种数据源。技术架构设计:需要充分考虑业务特性和性能要求,典型的分层架构包括感知层、推理层、执行层和反馈学习层四个核心部分。如:客户服务智能助手。如:金融投资分析系统。

2025-06-07 10:32:13 967

原创 AI Agent 与 Agentic AI 实现技术框架

AI Agent 协议的定义:本质是一个标准化的通信协议,定义了 Agent 之间以及 Agent 与外部系统之间的结构化通信的规则、格式和程序。作为系统的 “大脑”,结合领域适配的大模型与知识图谱,实现对复杂场景的理解和决策推理,例如在法律助手应用中,需要将最新法规与历史判例进行语义关联,支持类案推理;2024 年以来,随着 Multi-Agent 技术的成熟,涌现了一系列的 AI Agent 通信协议,包括:MCP、A2A、ANP、AP 等等。数据工程实施:核心在于构建高质量的专业知识库。

2025-06-07 10:10:36 719

原创 AI Agent 与 Agentic AI 综述

智能体(Agent)是一种能够 “感知环境→理解输入→规划决策→执行反馈”,以此来实现特定目标的软件实体,它们超越传统自动化脚本,不再依赖固定流程,而具备一定程度的环境适应与智能行为。智能体具有 4 大基本能力,如下图所示。记忆:分为短期记忆和长期记忆。是理解能力的基础,理解能力是指智能体解读用户指令、理解任务目标的能力。最新研究如 MobileFlow 引入了 GUI Chain-of-Thought(CoT)技术,使模型能够像人类一样进行推理,从而更好地理解复杂任务。

2025-06-06 01:05:02 963

原创 GPU 超级节点:AWS Trainium2 UltraServer

Trainium1 于 2020 年发布,使用 NeuronCore-v2 核心,是一款用于专注于 AI/ML 训练的加速芯片,支持 BF16 和 FP32 进行高精度训练,以及支持 TF32、FP16 和 INT8 以提高效率,还配备了专用的集合通信库芯片。可用于训练数十亿参数的大模型。2024 年,AWS 宣布了下一代 Trainium3 芯片,采用 3nm(纳米)制程,预计将比 Trainium2 提升 2 倍的性能,改善 40% 的能效,将于 2025 年底推出。所以,是的,这大约好 37.5%。

2025-05-19 00:34:02 2113

原创 英语口语错题集

解释:“Calling” is a verb or gerund, not a countable noun in this case. “Calls” is the correct plural noun for phone calls.解释:The subject “a person” already applies to both actions, so you don’t need to repeat “they need to”.解释:“Who talking” → “who talk”

2025-05-10 17:45:37 998

原创 人工智能发展史 — 物理学诺奖之 Hopfield 联想和记忆神经网络模型

约翰·霍普菲尔德(John Hopfield)文学士、物理学博士,研究领域横跨物理学、分子生物学、神经科学、计算机科学,是一名以推动跨学科交叉融合而闻名于世的科学家,其推动了物理学与生命科学、人工智能的交叉融合,被誉为 “扩展统计物理学边界的先驱”,获得了 2024 年的物理学诺贝尔奖。霍普菲尔德早期是理论物理学家,专注于固体物理和量子力学,研究电子行为与能量状态,在激化子、长程电子输运等方面有极大的贡献。

2025-05-03 11:49:52 1800

原创 人工智能发展史 — MP 模型和感知机模型的数学模型与编程应用

这意味着用于描述样本的特征需要由专家设计,算法性能依赖于人工设计和抽取这些特征的准确度,以便使模型能够完成特定的任务,因此它的应用受到了很大的限制。其中,“阈值逻辑”、“Hebb 学习率”,前 2 个理论解决了单个神经元层面的建模问题,来自于对大脑神经元的生理学研究,共同构成了 “感知机” 的理论基础,在 1950s 提出;所以,和 MP 模型一样,感知机模型也是一个应用于线性分类场景的 “二分类” 分类器,训练的目标是找到一个超平面(例如:在二维空间中的超平面是一条直线),来将特征空间中的样本分为两类。

2025-04-26 02:43:41 573

原创 案例分析:东华新径,拉动式生产的智造之路

客户对质量的吐槽:转向系统涉及汽车安全性关键,客户对产品质量要求极高,对故障率的态度是零容忍。产线对产量的吐槽:市场对产品的需求多变,生产线时而闲死,时而忙死,生产排班计划经常变化。生产计划是按月排的。后勤对仓库的吐槽:仓库需要提前一天备好物料,生产计划的频繁修改,让仓库备货手忙脚乱。仓库物料时按天备的。王总的吐槽:车间管理漏洞百出,东西乱摆乱放,小作坊现象严重。核心述求:如何确保产量的同时保证产品质量?产品质量问题根因追溯难、解决慢、成本高!生产计划跟不上市场订单的变化!

2025-04-11 23:58:19 1150

原创 AI 数理逻辑基础之统计学基本原理(上)

离散系数是一种 “无量纲” 的相对度量,公式如下,离散系数等于标准差除以均值,从而消除了量纲的影响,例如:1.4/6=0.23 和 14/60=0.23 之间的 CV 相同,但量纲相差了 10 倍。Pearson 用于测量 x 和 y 连续变量之间的线性相关性,但现实中存在大量非线性相关的数据集,但它们之间也会存在某种关联关系,如单调关系。掌握统计学的数据科学家或工程师,他们和具体的行业紧密相联,有扎实的统计基础,也有丰富的行业经验。通过海量数据进行分析,获得具有巨大价值的产品和服务,或深刻的洞见。

2025-04-04 23:58:42 1237 1

原创 联结主义人工智能发展史

核心思想是:认为人的智能归结为人脑的高层活动的结果,强调智能活动是由大量简单的单元通过复杂链接后并行运行的结果。弗兰克·罗森布拉特(Frank Rosenblatt)基于 MP 模型再进一步发明并在 IBM-704 计算机上实现了一种新的神经元数学模型,称为感知机模型(Perceptron),现在也将其称为一种单层神经网络,是神经网络和支持向量机的基础,作为早期神经网络研究的一个重要里程碑。即:感知机是二分类的线性模型,其输入的是实例的特征向量,输出的是实例的类别(+1 和 -1)。

2025-04-02 16:29:56 723

原创 AI 算力的科学衡量与计算方式

在这些应用中,对于一些实时性要求较高的任务,如图形渲染、音视频处理等,单精度浮点数能够提供足够的精度,并且在存储和计算上更加高效,能够满足实时性和资源限制的需求。我们知道,计算机是以 0 和 1 构成的二进制数字进行运算的,比如在基础的二进制里,1 就是 1,2 就变成了 “10”,3 是 “11”。算力(Computational Power):指计算机系统的运算能力,涵盖了 CPU、GPU、TPU、NPU 等运算芯片的能力特征,算力决定了计算机处理信息的速度和效率,是评估计算机整体性能的重要指标。

2025-03-26 20:47:10 1130

原创 GPU/CUDA 发展编年史:从 3D 渲染到 AI 大模型时代(上)

要彻底搞明白 GPU 和 CUDA 的运行原理并不容易,而回顾技术的发展历史则是知其然且知其所以然的一个好方法,所以本文会使用篇年纪的方式进行写作。

2025-03-03 00:32:31 4927 3

原创 NCCL AI 分布式训练集合通讯库技术基本原理

NCCL(NVIDIA Collective Communication Library)集合通讯库,是 NVIDIA 为 AI 模型开发者提供的、专用于控制多张 GPU 之间进行高效通信的 lib 库,应用于分布式 GPU 训练场景。如下深度学习软件堆栈图所示。NCCL 的北向是 AI 模型开发框架 PyTorch、Paddle、TensorFlow 等,这些 AI 框架通过集成、调用 NCCL lib 库来控制 GPU 之间的数据通信方式。

2025-02-28 12:59:57 1929

原创 大规模 RDMA AI 组网技术创新:算法和可编程硬件的深度融合

对于上述问题,HPCC 的核心思想是利用 INT(In-Network Telemetry,在网遥测)技术来提供精确的链路负载信息,并以此来计算出准确的 Sender 速率更新数值,并且实践发现 HPCC 在大多数情况下仅需要 Sender 更新一次速率,而无需迭代更新。TIMELY 算法的核心思想是通过测量报文的 RTT(端到端往返时间)来动态调整 Sender 的发送速率,基于 RTT 的变化进行梯度计算,进而根据梯度实现了基于速率(rate-based)的调速方法。

2025-02-22 19:10:14 1706

原创 RoCEv2 高性能传输协议与 Lossless 无损网络

它是 DCB (Data Center Bridging)标准的一部分,用于将流量分配到不同的队列,为每个队列分配一个权重,控制每个流量队列能够使用的带宽百分比,保证高优先级的流量,如 RDMA 流量通常会分配足够的带宽资源。因此,一旦出现丢包,就只能采用 go back N 重传机制,比如:网络链路上已经发送了 1,2,3,4,5 个数据包,假如当 2 这包丢掉了,那么 3,4,5 这三个包都要重传,重传的成本非常大。如下图所示,一旦发生丢包重传,RDMA 的性能就会急剧下降。

2025-02-22 10:45:05 2570

原创 RDMA 高性能通信技术原理

DMA 技术出现后,NIC 增加了 DMA Controller(DMA Engine)功能模块,首先将 NIC Rx/Tx Queue 与 Main Memory 中的 ZONE_DMA 建立映射关系,然后当 Frames 进入 NIC Rx/Tx Queue 时,DMA Controller 就会将这些 Frames 通过 DMA Copy 的方式存放到 ZONE_DMA 中,期间完全不需要 CPU 的参与。但相对的,由于连接机制和可靠性保障机制的存在,导致 RC 的通信开销较大。

2025-02-17 19:13:40 1527

原创 AI 技术原理与应用场景系列文章

RDMA 高性能通信技术原理》

2025-02-17 16:21:27 554

原创 8 卡 GPU 服务器与 NVLink/NVSwitch 互联技术

NVLink 是一种点对点的高速互连技术,单条 NVLink 就是一条全双工双路信道,每条 NVLink 链路可以将 2 个 GPU 直连起来,并且每个 GPU 可以提供多条 NVLink 接口连接多个 GPU。另外,PCIe Switch 互联拓扑中的 GPU 之间可能存在 GPU0→Switch0→CPU0→CPU1→Switch1→GPU7 的通信链路,它的通信不可避免的存在一定的延迟,因而更适合用于对信号效率不敏感且追求性价比的使用场景,如:推理、云计算等领域。本文讨论的是单机 GPU 卡间互联。

2025-02-06 22:02:48 2303

原创 人工智能发展历程

AI

2025-01-28 10:13:42 1450 1

原创 系统学英语 — 句法 — 复合句

其中常见的抽象名词有:news、idea、promise、question、doubt、thought、hope、message、suggestion、possibility、order、truth、proposal、belief 等。:使用代词 It 将冗长的主语代替并前置,真正的主语被后置。定语从句的 3 要素包括:先行词 + 定从引导词 + 从句结束位置。充当宾语的句子,通常位于谓语之后,也可以位于介词之后(介宾)和形容词之后(形宾)。充当主语的句子,通常位于谓语之前,不常见的也有主语后置的情况。

2025-01-27 19:20:00 1019

原创 共享图书产品需求分析

大数据分析软件:根据图书被借阅数据、人员借书数据分析读者的读书偏好以及书籍的热度,可对在校学生的阅读进行评估。其他行业:汽车合格证管理、高端鞋包租赁展示管理、企业保密档案管理、企业重要合同协议文件管理等。图书行业:图书馆智能书柜、中小学分布式图书馆、微型图书馆、共享图书、漂流书柜、图书无人零售;智能图书柜的应用场景是非常广泛的:学校、图书馆、社区、写字楼、大型企业、地铁等地方。医疗行业:药品无人零售、重点器材药品管理、医院重点档案检测报告管理等;15. (手机或卡片自动记录还书信息)17. 点击“换书”

2024-12-25 09:18:17 1110

原创 AWS re:Invent 2024 — AI 基础设施架构

最后,Peter 在 2024 re:Invent 第一天的 Keynote 中总结:“通过持续在诸如 Nitro、Graviton 和 Tranium2 等领域的核心创新投资,亚马逊云科技正在构建更强大的人工智能服务器。而持续的领先,来自于对硬件细节极致的追求。

2024-12-16 16:44:37 21708

原创 人工智能神经网络基本原理

MP 神经元数学模型是一个包含输入,输出与计算功能的模型。输入:权重:每个输入都就有一个权重。一个神经网络的训练算法就是让权重的值调整到最佳,以使得整个网络的预测效果最好。计算:下图展示了 2 个计算功能。输出:下图可见,z 是在 a 和 w 的线性加权和叠加了一个函数 g 的值。在 MP 模型里,函数 g 是 sgn 函数(取符号函数)。下面对神经元模型的图进行一些扩展。将 sum 函数与 sgn 函数合并到一个圆圈里,代表神经元的内部计算,即:MP 模型中的刺激函数 f。

2024-11-17 13:59:02 1742 2

原创 系统学英语 — 句子成分

句子成分的类型包括:主、谓、宾、表、定、状、补、同位语。

2024-11-06 09:13:06 786

原创 数据要素资料阅读笔记

数据空间是一种保障数据共享、流通和应用的分布式 可信数据流通基础设施,互联网龙头企业基于自身技术基础积极探索 数据空间方案,例如华为云交换数据空间 EDS、腾讯云数链通数据共 享平台、百度以区块链为核心的数据安全流通解决方案等,此外,中 国移动的数联网服务平台 DSSN、中国电信的数据要素融通服务平台 “灵泽”等均为企业搭建数据共享流通技术空间的有益实践。数据要素 的持有者,在收益未达预期时,不愿与更多人分享和复用,会采用多 种手段保护数据不被泄露,并限制其他人访问数据,这些限制导致数 据要素变得稀缺。

2024-10-11 00:21:13 531

原创 论文阅读笔记 —— 数字化转型对 Y 公司运营效率影响研究

Y 公司的发展 也得到了市场的肯定与关注,根据 Y 公司官网的相关统计数据显示,仅 2023 年, Y 公司的整车销量就达到了 336.7 万辆,同比增长幅度为 5.1%;其营业收入达 到了 6249.4 亿元,同比增长率达到了 6%。与此同时,Y 公司在技术领域、产品 领域以及战略布局等多个领域都处于行业领先的地位。

2024-10-07 00:38:41 584

原创 数智化转型资料阅读笔记

数字的定义:与其他信息资源相比具有可复制、可传输、可计算的特点。数字化的定义:包括数据的采集、传输、存储、计算和应用,是指将各类复杂多变的信息转变为可以度量的数据,并加以处理的过程。数字化转型的定义:指企业利用新一代数字技术,将某个生产经营环节乃至整个业务流程的物理信息链接起来,形成有价值的数字 资产,通过计算反馈有效信息,最终赋能到企业商业价值的过程。当今企业运用数字化相关技术和工具,推动企业转型, 从而将数字价值叠加到企业的商业价值,增强自身竞争力。

2024-10-06 00:40:52 576

原创 网络协议 — Keepalived 高可用方案

Keepalived 最初是为 LVS(Linux Virtual Server)L4 负载均衡方案而设计的 RS(真实服务器)集群健康状态检测软件,通过 TCP 和 IP 协议来实时(毫秒级)检测负载均衡后端集群中的每个 RS 节点的健康状态,并根据状态实现实时的 RS 节点移除和添加。以此来保证 RS 集群始终是 Keep Alive 的。优先级不会不断的提高或者降低,不管提高优先级还是降低优先级,最终优先级的范围是在 [1,254],不会出现优先级小于等于 0 或者优先级大于等于 255 的情况。

2024-07-10 19:49:39 769

原创 Intel HDSLB 高性能四层负载均衡器 — 代码剖析和高级特性

在前 2 篇文章中,我们从快速入门、应用场景、基本原理、部署配置这 4 个方面,整体地介绍了 Intel HDSLB 作为新一代高性能四层负载均衡器的研发背景、解决方案以及性能优势,并通过 step by step 的方式,希望帮助更多的读者能够便捷地在自己的开发机运行和使用起来。在本篇中,我们将继续向前,对 HDSLB-DPVS 开源版本的代码进行剖析,并介绍其中一些有趣的高级特性。Intel HDSLB 高性能四层负载均衡器 — 快速入门和应用场景。

2024-06-16 15:59:55 1595 1

原创 Intel HDSLB 高性能四层负载均衡器 — 基本原理和部署配置

在上一篇《Intel HDSLB 高性能四层负载均衡器 — 快速入门和应用场景》中,我们着重介绍了 HDSLB(High Density Scalable Load Balancer,高密度可扩展的负载均衡器)作为新一代高性能四层负载均衡器的需求定位、分析了 HDSLB 在云计算和边缘计算应用场景中的特性优势,以及解读了 HDSLB 的性能测试数据。再进一步的,在本篇中我们主要关注 HDSLB 的基本运行原理和部署配置方式,更侧重于实际的操作。

2024-05-26 21:43:56 1987

5G 核心网关键技术和对业务的支撑.pdf

5G 核心网关键技术和对业务的支撑.pdf

2020-04-30

H3C_CAS安装指导V1.0.docx

H3C_CAS安装指导V1.0.docx

2017-02-15

中国联通智能MEC技术白皮书.pdf

中国联通智能MEC技术白皮书.pdf

2020-04-30

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除