大势下的牛马-CSDN博客

原创从0到1打造企业AI知识库-课程目录

课程名称：「从0到1打造企业AI知识库：实用指南与生产落地」

2025-01-22 11:05:36 979

大纲可帮助您深入了解Ray的核心概念、实现原理和应用场景。您可以逐一学习每个主题，并进一步探索Ray的细节和高级功能。在学习过程中，可以查阅Ray的官方文档和相关的学术论文以获取更多详细信息。与其他框架和工具的集成（例如机器学习框架）调度器（Scheduler）的角色和功能。任务（Task）的概念和任务调度。Actor模型和Actor的执行。任务之间的依赖关系和任务调度策略。Actor之间的通信和消息传递。Ray的基本概念和核心组件。Ray的开源社区和贡献机制。任务的状态管理和错误处理。

2023-05-23 11:11:11 422

原创第23章：多智能体系统（MAS）的部署、监控与运维

本章将深入讲解多智能体系统（MAS）在企业级生产环境中的部署、监控与运维。内容涵盖分布式部署策略、可观测性设计、分布式调试、性能优化、容错与高可用、以及安全保障等关键环节。通过实际项目案例和代码示例，帮助你掌握 MAS 在生产环境中的落地方法。

2025-04-28 08:46:06 383

原创第22章：主流多智能体 (MAS)开发框架与工具

Java最著名和广泛使用的传统 MAS 框架之一。严格遵循 FIPA 标准（ACL、交互协议、Agent 管理服务 AMS、目录服务 DF）。提供图形化工具用于调试和管理。历史悠久，社区庞大，但相对较重。需要严格 FIPA 合规性、基于 Java 的大型、分布式 Agent 系统。Python基于 XMPP (Jabber) 协议进行通信，利用了 XMPP 的路由、在线状态、安全等特性。也支持 FIPA ACL。相对 JADE 更轻量级，利用 Python 的优势。

2025-04-28 08:45:25 82

原创第21章：多智能体系统 (MAS)中的协调与协作机制

协调与协作是发挥 MAS 潜力的关键。任务分配策略（市场、集中、分布式）决定了如何将工作分配给 Agent。资源共享与冲突解决机制（锁、优先级、协商等）管理对有限资源的访问。团队形成与动态重组使得 Agent 能够根据任务需求灵活地组合与调整。组织结构设计与角色动态分配提供了 Agent 间交互的框架，并允许根据情况调整职责。涌现行为是 MAS 的一个重要特性，理解和管理它对于确保系统按预期运行至关重要。掌握这些机制的设计和应用，是构建能够应对复杂、动态环境的智能、自适应多智能体系统的基础。

2025-04-28 08:43:53 54

原创第20章：Agent间通信与交互协议

有效的通信是多智能体系统协同工作的基石。通信语言 (ACL)定义消息意图，内容语言和本体论定义消息内容的语法和语义，确保互操作性。消息传递机制（点对点、广播、订阅/发布）决定消息如何分发，企业级系统常依赖消息中间件。交互协议（如合同网、拍卖、协商）为实现特定目标（任务分配、资源分配、达成共识）提供了结构化的对话流程。间接交互通过共享知识库或环境进行，是直接通信的重要补充。理解并恰当设计这些通信机制和协议，对于构建健壮、高效、可扩展的多智能体系统至关重要。

2025-04-28 08:42:42 43

原创第19章：Multi-Agent多智能体系统介绍

多智能体系统 (MAS) 是由多个自主的、交互的智能体组成的计算系统。这些智能体在一个共享的环境中运作，它们拥有各自的目标、知识和能力，并通过相互通信与协作（或竞争）来解决单个智能体难以或无法完成的复杂问题。特性单 Agent 系统多智能体系统 (MAS)组成通常只有一个核心智能体包含两个或多个交互的智能体交互主要与环境或其他非智能体实体交互智能体之间存在复杂的交互（通信、协调）目标追求自身目标可能有共享的全局目标，也可能有冲突的个体目标知识拥有自身的知识库。

2025-04-25 17:18:46 66

原创第18章：MCP在创作领域中的应用

MCP 框架为 AI Agent 深入参与创意领域提供了强大的支撑。通过整合记忆管理、上下文理解和规划能力，AI Agent 可以超越简单的内容生成，成为创作者在灵感激发、素材管理、内容创作、流程规划等方面的得力助手。这种人机协作的模式有望极大地提升创意工作的效率和质量，并可能催生出全新的创意形式。未来的挑战在于如何更好地理解和模拟创意过程中的直觉、情感和审美判断，以及如何设计更自然、更富有启发性的人机交互方式。

2025-04-25 17:17:33 65

原创第17章：MCP框架构建知识工作助手

MCP 框架为构建强大的知识工作助手提供了坚实的基础。通过整合记忆、上下文理解和规划能力，AI Agent 不再仅仅是信息的搬运工，更能成为知识工作者在信息获取、组织、分析、创造过程中的智能伙伴。实现这些高级功能需要克服数据获取、知识表示、LLM 能力整合等多方面的挑战，但其带来的效率提升和洞察发现潜力巨大，是 AI Agent 未来发展的重要方向。

2025-04-24 19:42:48 138

原创第16章：MCP服务端项目开发实战：对话系统

将 MCP 框架应用于对话系统，可以显著提升其智能水平和用户体验。通过有效的记忆管理，Agent 能够维持长对话的连贯性；通过利用用户记忆，可以实现个性化的交互；通过对话驱动的知识追踪与学习，Agent 能够不断进化。规划能力则使得 Agent 能够更结构化地处理复杂的用户请求。虽然实现一个完整的 MCP 对话系统涉及诸多挑战，但其带来的价值使得它成为未来智能对话交互的重要发展方向。

2025-04-24 19:41:06 71

原创第15章：MCP服务端项目开发实战：性能优化

性能优化和扩展是构建生产级 MCP 系统的关键环节。通过识别系统瓶颈，应用缓存策略、优化并发处理、采用分布式架构和水平扩展方案，可以显著提升 MCP Agent 的响应速度、吞吐量和可用性。在实践中，需要根据具体的应用场景、负载情况和成本预算，选择合适的优化技术和架构方案，并持续进行性能监控和调优。

2025-04-24 19:40:24 218

原创第14章：MCP服务端项目开发实战：多模态信息处理

多模态信息处理是 AI Agent 向更高级智能迈进的关键一步。通过引入多模态嵌入技术，MCP 框架可以在 Context、Memory 和 Planning 各个层面进行扩展，以实现对文本、图像、音频等多种信息的统一理解、融合、存储、检索和规划。利用强大的预训练多模态模型（如 CLIP, GPT-4V 等）是实现这些能力的核心。设计能够处理多模态数据流、调用多模态工具并与 MLLM 有效协作的 Context 和 Planning 组件，将是未来构建高级 AI Agent 的重要方向。

2025-04-24 19:39:10 70

原创第13章：MCP服务端项目开发实战：向量检索

Faiss (Facebook AI Similarity Search) 是一个非常流行的高效向量检索库，提供了多种 ANN 算法的实现。核心概念Index对象代表一个索引。常用索引类型: 精确搜索（暴力计算），用于基准测试或小数据集。L2 是欧氏距离，IP 是内积。: 基于倒排文件的精确搜索（先聚类缩小范围）。IndexLSH: 基于 LSH。: 基于 HNSW。IndexIVFPQ: 基于倒排文件 + 乘积量化。: 标量量化。基本流程创建索引，指定维度和算法参数。训练索引 (可选)

2025-04-24 19:38:12 65

原创第12章：MCP服务端项目开发实战：数据持久化

数据持久化与管理是 MCP 服务端不可或缺的一部分。选择合适的存储方案（向量库、SQL/NoSQL、缓存、对象存储）来满足不同数据的需求（性能、结构、查询方式）是基础。同时，高效管理用户画像和会使系统能够提供个性化和连续性的服务。最为重要的是，必须将数据安全和隐私保护贯穿于设计的始终，采取强有力的技术和管理措施，遵守法规要求，赢得用户的信任。下一章，我们将探讨向量检索和相似度计算的更高级主题。

2025-04-23 14:10:41 158

原创第11章：MCP服务端项目开发实战：核心服务实现

添加记忆项。: 搜索相关记忆。: 获取特定记忆。: 删除记忆。(可能): 获取指定会话的工作记忆。(可能): 添加到指定会话的工作记忆。: 构建上下文 Prompt。: 分解任务。: 执行计划（或下一步）。(可能): 获取计划状态。

2025-04-23 14:09:49 37

原创第10章：MCP 服务端架构设计

清晰、一致、易用的 API 是系统集成和客户端开发的关键。设计一个健壮的 MCP 服务端系统需要综合考虑架构模式（单体 vs. 微服务）、API 风格、数据流、状态管理以及长期的扩展性和可维护性。采用分层、模块化的设计，选择合适的通信机制和数据存储方案，并建立完善的监控、测试和部署流程，是构建成功的 MCP 服务端的关键。没有完美的架构，只有适合当前业务需求和团队能力的架构。在实践中，架构往往是逐步演进的。下一章，我们将更具体地探讨核心服务的实现细节。

2025-04-22 14:35:54 607

原创第9章：MCP框架中Planning组件设计

Planning 组件是实现 Agent 自主性和目标导向能力的核心。通过结合结构化的规划方法（如 HTN）和 LLM 的灵活性，Agent 可以有效地分解复杂任务、生成执行计划。健壮的执行器负责按计划调用工具和模型，并通过监控机制发现问题。动态的计划调整和优化能力使得 Agent 能够适应变化的环境，从失败中学习，最终更可靠地完成用户目标。设计和实现一个强大的 Planning 系统是构建高级 AI Agent 的关键挑战之一。接下来的章节将探讨如何将这些 MCP 组件整合到服务端架构中。

2025-04-22 14:33:42 31

原创第8章：MCP框架中Context 组件上下文处理

Context 组件是 MCP 框架的中枢神经系统，负责信息的汇聚、筛选、组织和呈现。通过有效的上下文表示、智能的窗口管理、精准的相关性计算以及灵活的压缩与扩展技术，Context 组件能够为 LLM 提供高质量的输入，最大限度地发挥其能力，同时克服其固有的上下文限制。设计良好的 Context 组件是构建高效、可靠、能够处理复杂任务的 AI Agent 的关键。下一章我们将探讨 Planning 组件，了解 Agent 如何进行任务规划和执行。

2025-04-22 14:33:03 40

原创第7章：记忆系统设计与实现

本章深入探讨了 MCP 框架中 Memory 组件的设计与实现，涵盖了短期记忆和长期记忆的管理。使用deque高效管理容量有限、快速访问的短期/工作记忆。长期记忆的核心挑战是基于内容的检索，向量数据库是实现这一目标的关键技术。以FAISS和ChromaDB为例，展示了如何利用向量数据库进行记忆的存储、相似度搜索和元数据过滤。模拟人类记忆的动态性，引入了基于访问频率、重要性和时间的强化与衰减机制，以及遗忘策略，以保持记忆系统的相关性和效率。选择和集成向量数据库。

2025-04-22 14:31:11 48

原创第6章：MCP 的理论基础

MCP 框架的设计融合了认知科学的记忆模型、计算语言学的上下文处理技术以及人工智能的规划理论。通过 Memory 组件模拟人类记忆系统，Context 组件优化信息处理和上下文利用，Planning 组件实现复杂任务的分解和执行，MCP 旨在构建一个更强大、更可靠、更接近人类认知能力的 AI Agent。理解这些理论基础有助于我们更好地设计、实现和优化 MCP 系统。

2025-04-22 14:30:11 21

原创第5章：MCP框架详解

MCP框架是一个专门设计用于增强大语言模型认知能力的系统架构，旨在解决LLM在实际应用中面临的关键挑战。该框架由三个核心组件组成：Memory(记忆)、Context(上下文)和Planning(规划)。

2025-04-21 16:25:57 253

原创第4章：AI Agent认知增强的必要性

在前三章中，我们介绍了AI Agent的基本概念、架构和常见框架。本章将深入探讨为什么需要对AI Agent进行认知增强，特别是针对基于大语言模型(LLM)的Agent系统。我们将分析当前LLM的能力边界和局限性，并为后续章节中介绍的MCP框架奠定理论基础。

2025-04-21 16:24:59 37

原创第3章：常见的 AI Agent 框架

随着AI技术的发展，涌现出了许多优秀的开源Agent框架，为开发者提供了便捷的工具和平台。本章我们详细介绍了三种主要类型的AI Agent框架：基于规则的Agent、基于学习的Agent和混合型Agent，并探讨了它们各自的原理、优缺点和适用场景。此外，我们还介绍了几个流行的开源Agent框架，包括LangChain、Rasa、AutoGPT、BabyAGI和LlamaIndex，这些框架为开发者提供了构建各种智能Agent的工具和平台。

2025-04-21 16:23:41 30

原创第2章：AI Agent 的基本架构

从计算机科学和人工智能的角度来看，AI Agent可以被定义为：一个AI Agent是一个计算系统，它存在于某个环境中，能够自主感知环境，并根据这些感知做出决策和采取行动，以实现其设计目标。环境交互：Agent不是孤立存在的，而是与环境有持续的交互目标导向：Agent的行为是为了实现特定的目标或目的自主决策：Agent能够独立做出决策，而不仅仅是执行预定义的指令AI Agent是一种能够感知环境、做出决策并采取行动的智能系统，具有自主性、感知能力、决策能力和执行能力等特性。

2025-04-21 13:58:40 144

原创第1章：AI Agent 概述

从计算机科学和人工智能的角度来看，AI Agent可以被定义为：一个AI Agent是一个计算系统，它存在于某个环境中，能够自主感知环境，并根据这些感知做出决策和采取行动，以实现其设计目标。环境交互：Agent不是孤立存在的，而是与环境有持续的交互目标导向：Agent的行为是为了实现特定的目标或目的自主决策：Agent能够独立做出决策，而不仅仅是执行预定义的指令AI Agent是一种能够感知环境、做出决策并采取行动的智能系统，具有自主性、感知能力、决策能力和执行能力等特性。

2025-04-21 13:57:52 28

原创 MCP服务端开发

管理短期和长期记忆：处理和理解上下文信息Planner：根据上下文制定回答策略API接口：提供HTTP接口供客户端调用"""单个记忆项"""id: str"""短期记忆模型""""""添加记忆项"""# 如果超过最大数量，移除最旧的"""获取最近的n条记忆""""""搜索相关记忆（简化版）"""# 实际应用中应使用向量搜索或其他相似度算法break"""清空短期记忆""""""长期记忆模型""""""添加或更新长期记忆""""""获取特定记忆"""

2025-04-18 17:12:04 172

原创 RAG知识库中引入MCP

Memory（记忆）：存储和管理历史交互和知识Context（上下文）：理解当前查询的背景和相关信息Planning（规划）：制定解决问题的策略和步骤。

2025-04-18 17:11:04 175

原创使用LLaMAFactory微调Qwen大模型

使用LLaMAFactory微调Qwen大模型

2025-03-27 19:06:33 370

原创企业级大模型微调

定义：企业级大模型微调是在通用预训练模型（如GPT、LLaMA、BERT等）基础上，使用企业私有数据对模型参数进行二次训练，使其适应特定业务场景（如法律文书生成、医疗诊断辅助、金融风控等）的过程。核心价值：关键步骤：数据要求：主流架构对比：选型建议：方法对比：参数设置参考：5. 训练实施硬件资源配置：性能优化技巧：核心指标：验证方法：通过上述系统性方法，企业可构建出既保持通用能力又具备领域专精特性的AI模型。建议初次实施时从LoRA微调起步，逐步积累数据后再尝试全参数微调。

2025-03-27 18:58:05 54

原创构建自定义MCP天气服务器：集成Claude for Desktop与实时天气数据

本文将指导开发者构建一个MCP（Model Control Protocol）天气服务器，通过暴露get-alerts和工具，为Claude for Desktop等客户端提供实时天气数据支持。该方案解决了传统LLM无法直接获取天气信息的痛点，支持美国国家气象服务API的天气警报和预报功能。

2025-03-22 23:49:58 495

原创 Model Context Protocol：下一代AI系统集成范式革命

MCP协议概述定义与价值：理解MCP作为标准化通信协议的角色，类比HTTP/SMTP的通用性核心功能：AI模型与外部数据源的动态集成、上下文管理、工具调用标准化发展背景：对比传统API集成的碎片化问题，MCP如何降低开发复杂度

2025-03-22 23:36:35 161

原创 AI Agent中的MCP详解

MCP（Model Context Protocol，模型上下文协议）是由Anthropic公司于2024年11月推出的开放标准协议，其核心目标是通过建立统一接口规范，解决AI模型与外部系统集成效率低下的行业痛点。该协议通过标准化通信机制，使大型语言模型（LLM）能够无缝对接数据库、API、文件系统等异构资源]，将传统AI的被动应答模式升级为具备主动任务执行能力的智能代理架构。

2025-03-21 19:34:41 235

原创 Elasticsearch8.17 集群重启操作

在关闭数据节点前，需禁用副本分片的分配，避免不必要的 I/O 操作。通过以上步骤，可安全执行 Elasticsearch 集群的全量或滚动重启，确保服务连续性和数据一致性。：升级模式下作业会自动恢复，但需确保重启后及时启用。：先启动主节点，待其形成集群后，再启动数据节点。：避免直接重启节点，否则可能导致分片分配混乱。：主分片已分配，副本未分配，服务可用。：所有分片及副本分配完成，最佳状态。：主分片未分配，服务不可用。与全集群重启步骤1相同。与全集群重启步骤2相同。与全集群重启步骤3相同。

2025-03-19 22:38:35 400

原创 Elasticsearch8.17 生产集群使用优化

设置为 **100MB**，超过此限制的文档将被拒绝索引。：建议分片总数不超过 **集群节点数 × 2**。例如，5节点集群分片总数建议不超过 **10**。注意单个请求大小不宜超过 **5MB**，避免内存压力。或 **搜索后游标（Search After Cursor）**，以避免内存和性能问题。建议重新设计数据结构，避免单个文档超过 **10MB**。：直接连接的本地存储性能优于远程存储（如 NAS/SAN），减少通信开销。为 **1s**，可调整为更长间隔（如。使用代码块统一配置示例，增强可读性。

2025-03-19 22:35:38 223

原创 Elasticsearch8.17 集群常见问题排查与解决

若系统索引（如 .kibana）被阻塞，可能导致 Kibana 显示 “Kibana Server is not Ready yet” 等问题。字段数量过多（如超过 index.mapping.total_fields.limit）会导致性能问题。若分片未迁移，可通过 cluster allocation explain API 获取分配阻塞原因。此版本优化了结构，添加了子标题、代码块格式化及步骤分点，同时保留了所有原始技术细节和解决方案。JVM 内存使用率持续超过 85% 会导致性能下降和断路器触发。

2025-03-19 22:31:19 169

原创 OpenManus交互流程

OpenManus交互流程。

2025-03-17 11:21:17 196

原创 OpenManus 架构的详细技术实现

实现端到端任务自动化。其架构设计强调灵活性、可扩展性和实时反馈，适合需要复杂任务处理的场景（如数据分析、流程自动化）。开发者可通过自定义工具和代理，快速构建适配特定需求的智能体系统。“帮我规划一个三天两晚的上海旅行，包括景点、交通和餐饮推荐。OpenManus 的核心在于通过。

2025-03-17 11:20:04 1258

原创 DeepSeek-R1大模型微调技术深度解析：架构、方法与应用全解析

DeepSeek-R1通过创新架构设计（MoE、动态专家系统）与高效微调技术（LoRA、GRPO），在推理性能、成本效益及多领域应用中展现出显著优势。其开源工具链与行业案例为开发者提供了从理论到实践的完整支持，推动大模型技术的落地与规模化应用。

2025-03-15 22:51:02 332

原创 Deepseek-R1大模型微调实战技术深度解析

Deepseek-R1基于Deepseek-V3-Base架构，通过MoE（Mixture-of-Experts）与MLA（Multi-Head Latent Attention）的协同设计，实现了参数规模与计算效率的平衡。如图1所示，在医疗问答微调案例中，仅需调整12%的专家参数即可实现领域知识的高效注入。采用分段余弦退火策略，初始学习率设为3e-5，在总step数的前30%阶段线性上升至5e-5，后阶段按余弦衰减至1e-6。通过官方提供的FP8量化工具包实现模型压缩，需配合HuggingFace的。

2025-03-15 22:43:24 295

原创 RAG技术深度解析：从原理到企业级应用实战

根据微软2023年技术报告，引入RAG后模型在金融风控场景的幻觉率降低至3.2%。RAG（检索增强生成）通过动态接入外部知识库，将检索与生成能力融合，使模型具备。实验数据显示，引入重排序后问答准确率提升17.3%。

2025-03-15 22:31:29 166

Openvoice安装依赖，checkpoints-1226，frpc-linux-amd64，snakers4-silero

redis-desktop-manager.deb redis客户端

smack_3_1_0.zip

estjs 2.0.2

空空如也