- 博客(316)
- 收藏
- 关注

原创 开源模型应用落地-解锁大语言模型的无限潜能
1、您是否也在迫不及待地期待在AI时代中展示自己的能力?2、您是否一直在研究如何使用开源模型?3、您是否一直在寻找将AI与业务结合的方向?4、您是否一直在寻找模型推理加速的方法?5、您是否一直在努力整合来自互联网上零散的资料?
2024-01-11 14:23:55
24146
85
原创 开源模型应用落地-qwen模型小试-Qwen3-8B-推理加速-vLLM-思考与非思考模式(四)
Qwen3通过“思考模式”与“非思考模式”的双模态架构,实现复杂推理与实时响应的灵活切换,为大语言模型在智能与效率间的平衡提供创新解法。
2025-05-07 08:30:00
304
9
原创 开源模型应用落地-qwen模型小试-Qwen3-8B-推理加速-vLLM-结构化输出(三)
通过vLLM框架高效部署QWen3-8B模型,并优化提示词工程与输出控制,实现稳定的结构化JSON生成,从而提升推理效率并拓展大模型应用场景。
2025-05-06 07:35:24
1469
7
原创 开源模型应用落地-qwen模型小试-Qwen3-8B-推理加速-vLLM-Docker(二)
通过容器化技术整合高性能推理框架vLLM与Qwen3-8B模型,可实现资源高效利用、灵活部署及推理性能优化,为大模型本地化应用提供轻量化解决方案
2025-05-06 07:34:21
1608
8
原创 开源模型应用落地-qwen模型小试-Qwen3-8B-推理加速-vLLM(一)
解析Qwen3-8B与vLLM的技术协同逻辑,探讨其在复杂任务中的性能表现及落地价值。
2025-05-05 16:01:11
1649
7
原创 开源模型应用落地-qwen模型小试-Qwen3-8B-快速体验-pipeline方式(二)
阿里云推出国内首个集成“快思考”与“慢思考”能力的 Qwen3-8B 大语言模型,以80亿参数和 128K 上下文支持,重塑AI应用边界并助力开发者高效部署
2025-04-30 18:33:59
6220
8
原创 开源模型应用落地-qwen模型小试-Qwen3-8B-快速体验(一)
阿里云推出国内首个集成“快思考”与“慢思考”能力的 Qwen3-8B 大语言模型,以80亿参数和 128K 上下文支持,重塑AI应用边界并助力开发者高效部署
2025-04-29 14:08:11
6790
6
原创 开源模型应用落地-全能音频新纪元-Kimi-Audio-7B-Instruct-重塑多模态交互边界
月之暗面开源的Kimi-Audio-7B-Instruct模型通过多任务融合架构与创新技术,实现了全场景音频交互的突破性进展
2025-04-28 18:36:53
6749
原创 开源模型应用落地-语音合成-MegaTTS3-零样本克隆与多语言生成的突破
MegaTTS3以0.45亿参数实现高质量中英双语语音合成与语音克隆,为语音合成领域带来全新可能性。
2025-04-24 21:00:00
6767
6
原创 开源模型应用落地-语音合成-Spark-TTS-零样本克隆与多语言生成的突破
Spark-TTS通过单流解耦技术解决因复杂的多阶段流程难以平衡效率与自然度的问题,实现了更高效的语音合成。
2025-04-23 20:00:00
1599
11
原创 开源模型应用落地-Podcastfy-从文本到声音的智能跃迁-Docker(二)
Podcastfy通过结合生成式AI和先进TTS技术,将文字、图片、视频等多种内容智能转化为多语言音频,支持高度自定义与多样化场景应用,引领“可听化”创作新风潮并重新定义声音经济时代的内容表达方式。
2025-04-22 18:36:44
8142
5
原创 开源模型应用落地-Podcastfy-从文本到声音的智能跃迁-Gradio(一)
通过Podcastfy,结合生成式人工智能和文本转语音技术,高效将多种内容形式转换为播客音频,实现灵活和专业的表达。
2025-04-16 20:00:00
12936
14
原创 开源模型应用落地-模型上下文协议(MCP)-第三方MCP Server实战指南(五)
第三方MCP Server通过复用社区共享的能力,大幅降低了开发者集成外部工具的门槛
2025-04-14 22:00:00
11887
5
原创 开源模型应用落地-LangChain与MCP协议-集成GPT-4o构建下一代AI智能体的全栈实践(三)
LangChain集成MCP协议与GPT-4o模型,构建高效、安全且可扩展的下一代AI智能体的全栈技术路径。
2025-04-10 13:58:50
15496
6
原创 开源模型应用落地-LangChain与MCP协议-重塑AI工具调用的未来格局(二)
集成LangChain将MCP工具无缝融入Agent工作流。
2025-04-09 08:30:00
15458
11
原创 开源模型应用落地-模型上下文协议(MCP)-从数据孤岛到万物互联(一)
模型上下文协议(MCP)通过标准化的接口和交互语法,重新定义AI与物理世界的连接,提升人机协作的深度与广度。
2025-04-08 19:45:00
16843
11
原创 开源模型应用落地-Qwen2.5-Omni-7B模型-Gradio-部署 “光速” 指南(二)
集成Gradio将Qwen2.5-Omni的复杂能力封装为交互式Web应用
2025-04-07 13:12:31
17144
10
原创 开源模型应用落地-Qwen2.5-Omni-7B模型-部署 “光速” 指南
阿里巴巴开源的全模态大模型Qwen2.5-Omni-7B以其强大的多模态感知能力和创新架构,标志着人机交互的重大突破,为普惠AI时代铺平道路。
2025-04-03 19:30:00
15388
12
原创 开源模型应用落地-LangGraph101-多智能体反思协同(七)
通过反思协同,多智能体系统能够在动态环境中持续进化,实现从简单任务分配到复杂问题求解的能力升级。
2025-03-26 18:33:30
34911
8
原创 开源模型应用落地-语音转文本-whisper模型-AIGC应用探索(五)
如何处理一段完整音频并生成字幕文件,弥补上一节中模型只能处理30秒音频的局限。
2025-03-25 19:00:00
29969
7
原创 开源模型应用落地-语音转文本-whisper模型-AIGC应用探索(四)
介绍OpenAI 最新开源的Whisper-large-v3-turbo模型,并集成vLLM进行推理加速。
2025-03-24 18:40:38
28582
8
原创 开源模型应用落地-LangGraph101-多智能体协同实践(六)
LangGraph 通过图形结构将多个智能体连接在一起,形成一个可以动态反馈的合作网络,实现更深层次的合作。
2025-03-21 20:45:37
29486
8
原创 开源模型应用落地-LangGraph101-ToolNode-智能工具调度的核心枢纽
通过ToolNode组件实现了智能体与工具之间的无缝衔接。
2025-03-21 13:19:22
30593
6
原创 开源模型应用落地-shieldgemma-2-4b-it模型小试-多模态内容安全检测(一)
ShieldGemma-2-4B-IT 凭借多模态能力、低资源需求和高精度检测,成为兼顾性能与安全性的开源图像审核工具。
2025-03-19 20:00:00
30510
15
原创 开源模型应用落地-LangGraph101-探索 LangGraph人机交互-更新历史Graph状态(三)
深入解析如何通过get_state_history与update_state两大核心方法,实现对历史对话状态的精准回溯与修改。
2025-03-13 20:15:00
29719
11
原创 开源模型应用落地-LangGraph101-探索 LangGraph人机交互-编辑Graph状态(二)
通过在Agent执行流程中实时中断并修改图状态,实现人机协同的精准控制与逻辑修正,提升智能系统的灵活性和适应性。
2025-03-11 18:36:46
32163
15
原创 开源模型应用落地-LangGraph101-探索 LangGraph人机交互-添加断点(一)
通过“断点机制”实现了智能系统的可控自主性。
2025-03-05 13:18:54
28948
10
原创 开源模型应用落地-Qwen2.5-7B-Instruct与vllm实现推理加速的正确姿势-自动前缀缓存-APC(八)
vLLM框架通过自动前缀缓存技术有效解决了大语言模型推理中的重复计算问题,显著提升了长上下文和多轮对话场景下的效率。
2025-03-04 08:30:00
28847
10
原创 开源模型应用落地-DeepSeek-R1-Distill-Qwen-7B与vllm实现推理加速的正确姿势(三)
使用 vLLM 清晰呈现推理过程
2025-03-03 09:00:00
29886
12
原创 开源模型应用落地-DeepSeek-R1-Distill-Qwen-7B-Docker助力-模型部署 “光速” 指南
借助Docker简化并加速DeepSeek-R1-Distill-Qwen-7B模型的部署
2025-02-24 18:41:56
34103
8
原创 开源模型应用落地-LangGraph101-探索 LangGraph跨线程持久化
深入剖析了LangGraph框架下的跨线程持久化技术,以解决在多线程环境中有效管理和存储用户数据的挑战。
2025-02-20 18:38:40
7253
13
原创 开源模型应用落地-DeepSeek-R1-Distill-Qwen-7B-LoRA微调-LLaMA-Factory-单机单卡-V100(一)
使用LLaMA-Factory高效微调qwen2.5-7b-instruct
2025-02-18 22:43:12
14303
20
原创 开源模型应用落地-LangGraph101-探索 LangGraph 短期记忆
本文探讨LangGraph框架中短期记忆管理的关键作用,并展示如何使用内存、sqlite和mysql实现智能体中的记忆功能。
2025-02-17 18:33:44
4775
17
原创 开源模型应用落地-Qwen1.5-MoE-A2.7B-Chat与vllm实现推理加速的正确姿势(一)
探讨 vllm 与 Qwen1.5-MoE-A2.7B-Chat 的整合
2025-02-12 15:42:41
9795
17
原创 开源模型应用落地-qwen模型小试-Qwen1.5-MoE-A2.7B-Chat-快速体验
Qwen1.5-MoE-A2.7B-Chat通过混合专家架构,以激活仅27亿参数的方式,实现了在对话和推理任务上与传统7B模型相媲美的性能。
2025-02-11 15:24:20
6883
13
原创 开源模型应用落地-LangGraph101-探索 LangGraph 的多图协作处理(五)
多图协作凭借提高模块化与可维护性,让复杂任务拆分清晰、代码复用便捷
2025-02-05 21:00:14
15491
22
原创 开源模型应用落地-DeepSeek-R1-Distill-Qwen-7B与vllm实现推理加速的正确姿势(二)
DeepSeek-R1-Distill-Qwen-7B模型通过蒸馏技术成功提炼Qwen-7B核心知识,旨在满足小型模型需求,并在全面测试中优化性能和拓展应用边界。
2025-02-03 09:00:00
5740
16
原创 开源模型应用落地-DeepSeek-R1-Distill-Qwen-7B与vllm实现推理加速的正确姿势(一)
DeepSeek-R1-Distill-Qwen-7B模型通过蒸馏技术成功提炼Qwen-7B核心知识,旨在满足小型模型需求,并在全面测试中优化性能和拓展应用边界。
2025-02-02 18:05:27
18881
13
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人