自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

以微薄之力,予他人些许温暖.

2009年,500元实习起步的小码农 ~ 2025年,努力奔小康的CTO

  • 博客(349)
  • 收藏
  • 关注

原创 开源模型应用落地-解锁大语言模型的无限潜能

1、您是否也在迫不及待地期待在AI时代中展示自己的能力?2、您是否一直在研究如何使用开源模型?3、您是否一直在寻找将AI与业务结合的方向?4、您是否一直在寻找模型推理加速的方法?5、您是否一直在努力整合来自互联网上零散的资料?

2024-01-11 14:23:55 24335 86

原创 开源模型应用落地-用LLaMA-Factory点亮Qwen3-4B的“读心术”(十九)

利用LLaMA-Factory结合LoRA技术微调Qwen3-4B模型,在有限算力下通过精细化数据与训练设计,提升AI对用户意图的理解准确率。

2025-08-13 10:03:48 77 9

原创 开源模型应用落地-RAG优化小技巧-ParentDocumentRetriever:解决RAG上下文割裂的分层检索方案(四)

ParentDocumentRetriever通过子文档检索与父文档关联的分层策略,兼顾语义匹配精度与上下文完整性,有效解决了RAG系统中文本分块粒度难以平衡的问题。

2025-08-05 12:25:59 3909 11

原创 开源模型应用落地-RAG优化小技巧-拆解复杂问题的多步推理引擎(三)

通过问题裂变引擎将复杂问题拆解为逻辑子问题、逐层推进形成“知识雪球”的智能问答系统,有效克服传统AI的知识碎片化难题,使复杂推理更精准深入。

2025-08-01 18:17:58 12315 5

原创 开源模型应用落地-RAG优化小技巧-本地检索器驱动下的MultiQuery多视角探索与RRF智能融合(二)

通过结合自定义本地检索器、MultiQueryRetriever和RRF算法,构建高效RAG系统,实现对复杂查询的多角度理解与多源信息融合,提升私有知识检索的精准性与召回质量。

2025-07-24 21:00:00 14285 14

原创 开源模型应用落地-RAG优化小技巧-用MultiQueryRetriever解锁信息检索的多维视角(一)

MultiQueryRetriever通过让大模型从单一问题生成多个等价查询,以多元视角提升检索覆盖率,实现智能问答系统的思维跃迁。

2025-07-23 21:00:00 14389 13

原创 开源模型应用落地-qwen模型小试-Qwen3-Embedding 模型集成 vLLM 实战解析(二)

Qwen3-Embedding凭借卓越的多语言理解和文本表征能力,结合vLLM框架实现高效推理,推动语义检索和生成任务迈向新高度。

2025-07-16 19:30:00 4893 12

原创 开源模型应用落地-qwen模型小试-Qwen3-Reranker 模型集成 vLLM 实战解析(一)

本文介绍了将Qwen3-Reranker模型集成至高效推理引擎vLLM的技术方案,旨在提升大模型在信息爆炸时代下的排序效率与应用落地能力。

2025-07-15 18:29:20 5525 6

原创 开源模型应用落地-OpenAI Agents SDK-集成多个MCP Servers与Qwen3-8B模型的创新应用探索(九)

本文探讨如何结合OpenAI Agents与多MCP服务器及Qwen3-8B模型,构建高效且功能丰富的AI解决方案,以提升AI代理对外部资源的理解与操作能力。

2025-07-09 10:27:15 10332 10

原创 开源模型应用落地-OpenAI Agents SDK-集成MCP【SSE机制】与Qwen3-8B模型的创新应用探索(八)

探讨OpenAI Agents集成MCP【SSE】与Qwen3-8B模型的技术组合在智能应用中的实际场景与价值。

2025-07-08 07:00:00 10765 11

原创 开源模型应用落地-OpenAI Agents SDK-集成MCP与Qwen3-8B模型的创新应用探索(七)

探讨OpenAI Agents集成MCP与Qwen3-8B模型的技术组合在智能应用中的实际场景与价值。

2025-07-07 15:37:12 10707 4

原创 开源模型应用落地-让AI更懂你的每一次交互-Mem0集成Qdrant、Neo4j与Streamlit的创新实践(四)

在AI快速发展的背景下,Mem0结合Qdrant、Neo4j和Streamlit构建了一个具备长期记忆、个性化服务与实时推理能力的智能记忆助手,探索AI记忆系统的无限可能。

2025-07-03 15:14:10 12153 10

原创 开源模型应用落地-OpenAI Agents SDK-集成Qwen3-8B-探索output_guardrail的创意应用(六)

Output Guardrail作为关键安全机制,在生成内容后进行审核与过滤,确保其安全、合规并符合预期,从而提升AI系统的可信度和稳健性

2025-07-02 07:30:00 15104 10

原创 开源模型应用落地-OpenAI Agents SDK-集成Qwen3-8B-探索input_guardrail 的创意应用(五)

本文介绍 OpenAI Agents 中用于保障交互安全的 input_guardrail 工具,探讨了其工作原理与实际应用,帮助开发者提升系统的安全性和用户体验。

2025-07-01 19:45:00 15292 8

原创 开源模型应用落地-让AI更懂你的每一次交互-用LangChain、Streamlit与Redis构建AI模型的“不忘”人生(三)

在人工智能中,记忆是稀有而重要的能力,传统对话模型仅能记住最近的交互内容,但借助LangChain的ConversationSummaryBufferMemory、Redis内存数据库和Streamlit界面,构建一个具有长期记忆能力的AI对话系统。

2025-06-27 16:41:35 20367 15

原创 开源模型应用落地-让AI更懂你的每一次交互-用Redis Stack与LangChain解锁大模型的长期记忆潜能(二)

结合 Redis Stack 与 LangChain 构建外部记忆系统,以提升大型语言模型的长期记忆与持续学习能力。

2025-06-24 12:09:08 18645 7

原创 开源模型应用落地-让AI更懂你的每一次交互-mem0-QDrant-Streamlit(一)

本文介绍了为解决大型语言模型缺乏持久记忆问题而设计的智能记忆层Mem0,并将指导如何使用Streamlit搭建其测试Web UI。

2025-06-19 22:15:00 18607 9

原创 开源模型应用落地-工具使用篇-从零开始搭建Qdrant Web UI-可视化管理工具-Windows(十)

Qdrant Web UI 是一个简洁友好的可视化界面,用于简化 Qdrant 向量数据库的管理与操作,降低使用门槛。

2025-06-13 18:11:35 19075 2

原创 开源模型应用落地-语音合成-Spark-TTS-非标准词处理技巧(二)

本文探讨了Spark-TTS如何通过文本归一化方法有效处理非标准词,以提升语音合成的质量与自然度。

2025-06-11 07:00:00 13993 3

原创 开源模型应用落地-语音合成-Spark-TTS-长文本高效自然的中文语音合成体验(一)

本文详细介绍 Spark-TTS 在长文本处理方面的实际应用方法。

2025-06-10 07:00:00 20205 13

原创 开源模型应用落地-OpenAI Agents SDK-集成Qwen3-8B-多Agents联动(四)

OpenAI Agents SDK 通过简化多智能体协作系统的开发流程,显著提升了任务自动化效率与系统可扩展性。

2025-06-09 07:00:00 21053 5

原创 开源模型应用落地-OpenAI Agents SDK-集成Qwen3-8B-多个Tools(三)

OpenAI Agents SDK 是一个基于 Python 的强大工具集,能够帮助开发者快速构建从简单任务到复杂决策的智能代理应用,显著提升程序的智能化水平 。

2025-06-05 08:00:00 25163 13

原创 开源模型应用落地-OpenAI Agents SDK-集成Qwen3-8B-function_tool(二)

OpenAI Agents SDK 是一个基于 Python 的强大工具集,能够帮助开发者快速构建从简单任务到复杂决策的智能代理应用,显著提升程序的智能化水平 。

2025-06-04 18:30:08 20255 3

原创 开源模型应用落地-OpenAI Agents SDK-集成Qwen3-8B(一)

OpenAI Agents SDK 是一个基于 Python 的强大工具集,能够帮助开发者快速构建从简单任务到复杂决策的智能代理应用,显著提升程序的智能化水平 。

2025-06-03 20:30:00 20632 3

原创 开源模型应用落地-模型上下文协议(MCP)-安全认证的创新与实践探索(十)

MCP安全认证对于保障人工智能生态系统中数据完整性、身份真实性和访问控制至关重要,本文将深入探讨其核心机制与行业实践。

2025-05-27 19:00:00 28496 11

原创 开源模型应用落地-模型上下文协议(MCP)-Context-深入解析sampling_callback机制与应用场景(九)

sampling_callback实现了模型与外部工具的高效协同,不仅突破了传统单向交互模式,还通过动态上下文扩展与状态监控为开发者提供了灵活的定制化能力。

2025-05-26 08:00:00 18200 4

原创 开源模型应用落地-模型上下文协议(MCP)-Context-深入解析message_handler机制与应用场景(八)

message_handler是MCP中实现服务端与客户端高效通信、实时反馈任务进度的核心组件。

2025-05-22 08:00:00 23700 3

原创 开源模型应用落地-模型上下文协议(MCP)-Context-深入解析logging_callback机制与应用场景

logging_callback在MCP中实现模型调用链追踪、错误诊断与性能优化

2025-05-21 08:00:00 25905 11

原创 开源模型应用落地-模型上下文协议(MCP)-Prompt-提示词的使用逻辑(七)

通过 Model Context Protocol(MCP)中的 Prompt 提升与大型语言模型交互的效率和规范性。

2025-05-20 07:30:00 28597 15

原创 开源模型应用落地-模型上下文协议(MCP)-Resource Template-资源模板的使用逻辑(六)

Resource Template 是 MCP 中支持动态生成定制化资源的核心机制,通过参数化设计实现按需上下文注入,广泛适用于自动化运维、云计算与AI交互场景。

2025-05-19 14:19:02 29150 6

原创 开源模型应用落地-模型上下文协议(MCP)-Resources-资源的使用逻辑

深入解析MCP资源的使用逻辑,从协议规范到实战场景,探讨如何通过这一机制释放大模型的无限潜能。

2025-05-15 15:58:15 30524 4

原创 开源模型应用落地-qwen模型小试-Qwen3-8B-融合VLLM、MCP与Agent(七)

Qwen3凭借其智能体能力、MCP协议支持与高效部署特性,正加速在金融、制造、科研等多个企业场景中的落地应用,推动智能化转型与业务闭环构建。

2025-05-13 10:23:49 30709 13

原创 开源模型应用落地-qwen模型小试-Qwen3-8B-推理加速-vLLM-MCP的完美融合(六)

Qwen3-8B接入MCP,实现动态地连接外部工具和服务,从而极大地增强了其处理复杂任务的能力。

2025-05-09 07:45:00 22918 8

原创 开源模型应用落地-qwen模型小试-Qwen3-8B-推理加速-vLLM-Tools助力(五)

在人工智能大模型迅速发展的今天,如何让模型更智能地与外部世界交互,成为提升其实际应用能力的关键。

2025-05-08 08:30:00 26446 14

原创 开源模型应用落地-qwen模型小试-Qwen3-8B-推理加速-vLLM-思考与非思考模式(四)

Qwen3通过“思考模式”与“非思考模式”的双模态架构,实现复杂推理与实时响应的灵活切换,为大语言模型在智能与效率间的平衡提供创新解法。

2025-05-07 08:30:00 27107 13

原创 开源模型应用落地-qwen模型小试-Qwen3-8B-推理加速-vLLM-结构化输出(三)

通过vLLM框架高效部署QWen3-8B模型,并优化提示词工程与输出控制,实现稳定的结构化JSON生成,从而提升推理效率并拓展大模型应用场景。

2025-05-06 07:35:24 28121 10

原创 开源模型应用落地-qwen模型小试-Qwen3-8B-推理加速-vLLM-Docker(二)

通过容器化技术整合高性能推理框架vLLM与Qwen3-8B模型,可实现资源高效利用、灵活部署及推理性能优化,为大模型本地化应用提供轻量化解决方案

2025-05-06 07:34:21 28770 11

原创 开源模型应用落地-qwen模型小试-Qwen3-8B-推理加速-vLLM(一)

解析Qwen3-8B与vLLM的技术协同逻辑,探讨其在复杂任务中的性能表现及落地价值。

2025-05-05 16:01:11 14296 11

原创 开源模型应用落地-qwen模型小试-Qwen3-8B-快速体验-批量推理(三)

使用Transformers的pipeline实现批量推理

2025-05-05 13:51:38 14299 9

原创 开源模型应用落地-qwen模型小试-Qwen3-8B-快速体验-pipeline方式(二)

阿里云推出国内首个集成“快思考”与“慢思考”能力的 Qwen3-8B 大语言模型,以80亿参数和 128K 上下文支持,重塑AI应用边界并助力开发者高效部署

2025-04-30 18:33:59 20448 10

开源模型应用落地-工具使用篇-从零开始搭建Qdrant Web UI-可视化管理工具-Windows(十)

Qdrant-Web-UI资源文件

2025-06-13

Qwen3对话模版-qwen3-nonthinking.jinja

阻止模型生成思考内容

2025-05-06

开源模型应用落地-Podcastfy-从文本到声音的智能跃迁-Gradio(一)

DeepSeek 15天指导手册——从入门到精通文件生成的PodCast音频

2025-04-16

开源模型应用落地-音乐生成模型-MusicGen深度使用-AIGC应用探索(五)

input.wav为4.4.章节的参考音频 prompt.wav为4.5章节的参考音频

2024-06-12

开源模型应用落地-语音转文本-whisper模型-AIGC应用探索(四)-测试音频

开源模型应用落地-语音转文本-whisper模型-AIGC应用探索(四)-测试音频

2024-06-03

开源模型应用落地-语音转文本-whisper模型-AIGC应用探索(二)-测试音频

开源模型应用落地-语音转文本-whisper模型-AIGC应用探索(二)-测试音频

2024-05-30

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除