
DeepSeek入门到精通(实战指南)
文章平均质量分 97
《DeepSeek入门到精通》专为DeepSeek技术打造的全方位学习专栏。内容涵盖基础理论、架构解析、使用技巧、应用实践、开发部署、推理优化及微调训练等关键环节。通过通俗易懂的讲解、实用技巧分享和真实案例剖析,帮助读者快速从理论迈向实践,掌握DeepSeek的全链路应用。
寻道AI小兵
10年+互联网架构师,聚焦AI大模型开发实战,分享前沿技术,解锁AI新技能,共探智能未来!
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
【DeepSeek微调实践】复现前沿模型:基于 DeepSeek-R1 蒸馏数据训练专属中文推理模型全攻略
DeepSeek-R1 模型以其卓越的性能在自然语言处理领域引起了广泛关注,其基于 R1 蒸馏数据进行 SFT(Supervised Fine-Tuning)的小模型也展现出了强大的效果。近期,一位在 NLP 领域极具影响力的专家“刘聪 NLP”开源了中文 DeepSeek-R1(满血)蒸馏数据集,包括 SFT 版本和普通版本。这一数据集的发布,迅速吸引了众多研究者和开发者的目光,并成功登上了 HuggingFace Trending 榜。原创 2025-04-02 08:00:00 · 1179 阅读 · 39 评论 -
【DeepSeek应用实践】Ollama Deep Researcher:Ollama平台部署DeepSeek-R1,打造本地AI研究助手
在当今数字化信息爆炸的时代,高效获取和整理信息成为了科研工作和专业研究中的关键环节。随着人工智能技术的飞速发展,大语言模型(LLM)在信息处理和自然语言理解方面展现出了巨大的潜力。Ollama Deep Researcher 应运而生,它是一款结合了 LangChain 和 Ollama 框架优势的本地化 AI 研究助手,旨在通过自动化的方式帮助用户进行深度网络调研和报告撰写,为研究人员和专业人士提供了一种高效、安全且灵活的研究工具。原创 2025-04-01 08:00:00 · 1478 阅读 · 39 评论 -
【DeepSeek微调实践】DeepSeek-R1大模型基于MS-Swift框架部署/推理/微调实践大全
MS - Swift 是一款专为大模型部署而精心打造的高效框架,具备出色的兼容性与丰富的功能特性。在模型类型支持上,无论是专注于文本处理的纯文本模型,还是融合文本、图像、音频等多种信息模态的多模态模型,亦或是擅长文本序列分类任务的序列分类模型,MS - Swift 均能为其提供适配的部署环境。另外在功能层面,MS - Swift 框架提供了基于 Gradio 的 Web UI。原创 2025-03-31 08:00:00 · 7780 阅读 · 41 评论 -
【DeepSeek应用实践】手把手教程:用 AnythingLLM + Ollama + DeepSeek-R1 搭建本地企业知识库
在众多的技术方案中,我们选择了 AnythingLLM、Ollama 和 DeepSeek-R1 这一组合来搭建本地知识库。Ollama 作为一个轻量级的本地化大语言模型部署工具,支持多种模型,易于安装和使用,能够快速在本地运行强大的语言模型。DeepSeek-R1 是一个专为知识库问答设计的检索增强生成(RAG)模型,它结合了检索和生成的优势,能够快速从知识库中检索相关信息并生成精准答案。而 AnythingLLM 则是一个用户友好的界面工具,可以方便地连接 Ollama 和 DeepSeek-R1原创 2025-03-28 08:00:00 · 1675 阅读 · 2 评论 -
【DeepSeek部署实战】一键本地推理,DeepSeek-R1 蒸馏模型 + llama.cpp 部署教程
在当今快速发展的 AI 领域,本地运行大型语言模型(LLM)的需求日益增长。llama.cpp 是一个高性能的 C/C++ 库,专门用于运行 LLM,支持多种硬件加速选项。本文将详细介绍如何使用 llama.cpp 在本地运行 DeepSeek-R1 蒸馏模型(1.5B-GGUF),帮助您在消费级硬件上实现高效推理。通过llama.cpp运行DeepSeek-R1蒸馏版模型,您可以在消费级硬件上体验高性能推理。llama.cpp提供了灵活的配置选项,支持多种硬件加速方式,并且易于部署。原创 2025-03-27 08:00:00 · 1971 阅读 · 37 评论 -
【DeepSeek开发实战】DeepSeek-R1-Distill-Qwen与LangChain的本地大模型应用开发指南
在大模型应用开发的浪潮中,将强大的大语言模型与灵活的开发框架相结合,能为开发者开启无限可能。本文将详细阐述如何基于DeepSeek-R1-Distill-Qwen大模型与LangChain框架进行本地大模型应用开发,从基础环境搭建到实际应用演示,为你提供全面且深入的指导。无论你是想探索大模型应用开发的新手,还是寻求优化现有项目的资深开发者,都能在本文中找到有价值的内容。原创 2025-03-25 08:00:00 · 1330 阅读 · 32 评论 -
【DeepSeek部署实战】基于Ollama+Chatbox零成本部署DeepSeek-R1系列模型攻略(Windows)
在人工智能领域,DeepSeek 作为国产大模型的第一梯队选手,凭借其卓越的算法优化和高性能表现(支持代码生成、数学推理、多轮对话等场景)持续领跑行业。然而,尽管官方提供了免费的网页版服务,但在实际使用中,用户常常面临三大痛点:网络延迟高(尤其是在代码生成场景中)、隐私数据外泄风险以及高峰期服务器响应缓慢。为了解决这些问题,本文将介绍一种基于 Ollama 和 Chatbox 的黄金组合方案,手把手教您在 Windows 系统上实现零成本本地化部署 DeepSeek-R1 系列模型,原创 2025-03-24 10:21:53 · 1583 阅读 · 30 评论 -
【DeepSeek部署实战】基于Ollama快速部署DeepSeek-R1系列模型实战指南(Linux)
在人工智能飞速发展的当下,大语言模型成为了众多领域创新的关键驱动力。DeepSeek-R1系列模型凭借其卓越的性能和独特的技术优势,在国产推理模型中脱颖而出,备受关注。本文将详细介绍如何通过Ollama这一便捷工具,快速实现DeepSeek-R1系列模型的部署,为开发者提供全面且实用的实战指南。通过本文的详细介绍,相信开发者已经掌握了基于Ollama快速部署DeepSeek-R1系列模型的方法和技巧,以及在部署和使用过程中需要注意的各种事项。原创 2025-03-24 08:00:00 · 1077 阅读 · 10 评论 -
【DeepSeek部署实战】DeepSeek-R1-Distill-Qwen-7B:基于vLLM 搭建高性能推理服务器
大语言模型的落地应用离不开高效推理框架的支持,vLLM以其卓越的性能在众多框架中脱颖而出。本文将带你深入探索如何使用vLLM框架部署DeepSeek-R1-Distill-Qwen大语言模型,无论是深度学习新手还是有经验的开发者,都能从中获取实用的知识和技能。# 创建采样参数。temperature 控制生成文本的多样性,top_p 控制核心采样的概率# 初始化 vLLM 推理引擎# 初始化 vLLM 推理引擎。原创 2025-03-21 08:00:00 · 4068 阅读 · 40 评论 -
【DeepSeek部署实战】DeepSeek-R1-Distill-Qwen-7B:Web聊天机器人部署指南
随着人工智能技术的飞速发展,大语言模型已成为推动智能化应用的关键力量。DeepSeek-R1-Distill-Qwen-7B 作为一款高性能的蒸馏模型,不仅继承了大模型的强大推理能力,还通过优化大幅降低了部署成本。本文将手把手教你如何基于该模型搭建一个支持 128K 上下文、可视化思考过程的 Streamlit 聊天机器人,为用户提供智能且交互性强的体验。无论你是 AI 初学者还是技术爱好者,都能通过本文的详细指导轻松上手!原创 2025-03-19 08:00:00 · 3241 阅读 · 38 评论 -
【DeepSeek部署实战】DeepSeek-R1-Distill-Qwen-7B:本地部署与API服务快速上手
在人工智能飞速发展的今天,大语言模型已成为推动创新的核心力量。DeepSeek-R1-Distill-Qwen-7B 是深度求索(DeepSeek)推出的蒸馏版大语言模型,基于 Qwen-7B 进行知识蒸馏训练。它在保留 90% 以上性能的同时,显著降低了推理成本,为开发者提供了高性价比的选择。本教程将手把手教你如何借助 FastAPI 框架,将这一强大的模型部署为 API 服务,让应用开发更加便捷。原创 2025-03-17 08:00:00 · 1877 阅读 · 50 评论 -
【DeepSeek开发入门】Function Calling 函数功能应用实战指南
在人工智能开发领域,DeepSeek 以其丰富的功能和强大的性能备受关注。其中,Function Calling(函数调用)功能为开发者提供了一种全新的交互方式,使得模型能够与外部工具和函数进行交互,极大地拓展了模型的应用能力。本文将深入探讨 DeepSeek Function Calling 的原理、使用方法、应用场景以及开发过程中的注意事项。Function Calling 允许模型根据用户的输入,判断是否需要调用外部函数来完成任务。原创 2025-03-14 08:00:00 · 2356 阅读 · 38 评论 -
【DeepSeek开发入门】DeepSeek API高级开发指南(推理与多轮对话机器人实践)
在AI开发的前沿领域,DeepSeek凭借其强大的功能和灵活的接口,为开发者提供了广阔的创新空间。本文将围绕DeepSeek的推理模型、多轮对话以及JSON模式这三个重要特性展开深入探讨,详细介绍相关接口的使用方法、应用场景及开发要点,助力开发者充分发挥DeepSeek的潜力,打造出更加智能、高效的应用。DeepSeek的推理模型()是专门为复杂推理任务设计的。与普通的对话模型不同,它能够理解和处理更具逻辑性和深度的问题,在需要进行推理、分析和判断的场景中表现出色。原创 2025-03-12 08:00:00 · 2258 阅读 · 43 评论 -
【DeepSeek开发入门】DeepSeek API 开发初体验
在人工智能蓬勃发展的时代,DeepSeek作为一款功能强大的AI大模型,为开发者提供了丰富的接口和便捷的开发体验。本文将基于DeepSeek的几个关键接口,带你快速入门,开启DeepSeek开发的探索之旅。通过本文,你已经初步了解了DeepSeek开发中几个重要接口的使用方法,包括列出模型、对话补全和查询余额接口,以及开发过程中的常见问题及解决办法。这是你踏入DeepSeek开发领域的第一步。在后续的学习中,你可以深入研究模型的参数调优,探索不同模型在各种场景下的应用,如利用模型实现更复杂的推理对话功能。原创 2025-03-10 08:00:00 · 1863 阅读 · 6 评论 -
【DeepSeek应用实践】通义灵码 + DeepSeek:AI 编程助手的实战指南
通义灵码结合 DeepSeek-V3 和 DeepSeek-R1 模型,为开发者提供了强大的编程辅助功能。无论是简单的代码生成,还是复杂的算法实现,通义灵码都能轻松应对。通过模型选择功能,开发者可以根据具体需求选择最适合的模型,进一步降低 AI 编程技术的门槛。在未来,通义灵码将继续支持更多模型,为开发者提供更加开放和多元的工具服务。如果你正在寻找一款提升开发效率的工具,通义灵码绝对值得一试!原创 2025-03-05 08:00:00 · 2117 阅读 · 48 评论 -
【DeepSeek应用实践】Cline集成DeepSeek:开源AI编程助手,终端与Web开发的超强助力
Cline 是一款强大的 AI 编程助手,结合了 DeepSeek-V3 和 DeepSeek-R1 等高性能模型,为开发者提供了高效、智能的编程体验。无论是日常开发任务还是复杂的推理问题,Cline 都能提供强大的支持。如果你正在寻找一款提升开发效率的工具,Cline 绝对值得一试!原创 2025-03-07 08:00:00 · 3287 阅读 · 59 评论 -
【DeepSeek应用实践】DeepSeek接入Word、WPS方法详解:无需代码,轻松实现智能办公助手功能
DeepSeek接入Word、WPS方法详解:无需代码,轻松实现智能办公助手功能原创 2025-03-03 08:00:00 · 3490 阅读 · 0 评论 -
DeepSeek新手教程:从入门到大神全攻略
在人工智能技术日新月异的当下,DeepSeek作为一款极具实力的国产大模型AI助手,已悄然走进众多用户的日常,成为提升工作效率、激发无限创意的得力伙伴。无论你是在知识海洋中奋力遨游的学生,还是在职场拼搏的打工人,亦或是专注钻研的开发者、灵感四溢的创作者,DeepSeek都能像贴心助手一样,为你提供全方位、多元化的支持。本文将全方位、无死角地为你拆解DeepSeek的使用方法与实用技巧,助力你快速上手,深度挖掘这款AI助手的无限潜力,让你在AI赋能的时代浪潮里,抢占先机,高效前行。免费使用。原创 2025-02-27 08:00:00 · 1592 阅读 · 4 评论 -
DeepSeek未来展望与技术发展趋势洞察
本文对DeepSeek的未来发展趋势进行了全面展望,其在技术演进和应用拓展方面具有巨大的潜力,但也面临着技术和社会伦理等方面的挑战。了解这些趋势和挑战,有助于我们在使用DeepSeek的过程中,充分发挥其优势,积极应对可能出现的问题。在未来,我们应持续关注DeepSeek的发展,不断探索其在各个领域的应用,同时关注技术创新和伦理规范,确保DeepSeek的健康发展,为社会创造更多的价值。原创 2025-02-26 08:00:00 · 1253 阅读 · 1 评论 -
DeepSeek进阶之路:复杂任务处理与协同创新
本文深入探讨了基于DeepSeek的复杂任务处理方法和人机协同创新模式。通过强化提示语链的运用,结合思维模型优化提示语链,能够更高效地处理复杂任务;通过优化人机协同流程、提升协同效率,实现了人机深度融合和创新成果的提升。这些进阶技巧和方法将帮助大家在使用DeepSeek的过程中实现更高层次的应用,充分发挥DeepSeek的潜力。在未来的学习和工作中,持续探索和实践这些方法,将为我们带来更多的创新和价值。后续文章将展望DeepSeek的未来发展趋势,以及这些趋势对我们应用DeepSeek的影响。原创 2025-02-25 08:00:00 · 1302 阅读 · 2 评论 -
DeepSeek提示语避坑:新手提示误区指南与创新策略
本文深入剖析了新手在使用DeepSeek提示语时常见的误区,包括初始提示语构建、AI输出处理及伦理考量等方面,并给出了针对性的应对策略,帮助用户精准驾驭提示语,规避风险。同时,文中阐述了AI伦理的核心要点,强调遵循伦理原则的重要性;提供的提示语设计检查清单,可辅助用户系统审视提示语,确保其质量与有效性;创新提示语设计策略部分,则为挖掘DeepSeek潜力、实现创意与高效交互提供了思路。原创 2025-02-24 08:00:00 · 1429 阅读 · 2 评论 -
DeepSeek提示词攻略:高效交互的关键密码
本文重点介绍了提示词设计、优化及提示语链应用的关键知识和技巧。提示词由指令、上下文信息和期望结果引导构成,不同任务类型的提示词有不同特点。优化提示词可以从提升准确性、增强引导性和根据反馈调整等方面入手。提示语链通过合理分解任务和设计逻辑关联,能有效处理复杂任务。掌握这些提示词技巧,能够帮助读者更好地与DeepSeek进行交互,充分发挥DeepSeek的强大功能,提升工作和学习效率。在后续的实践中,读者可以不断尝试运用这些技巧,进一步探索DeepSeek在复杂任务中的处理以及人机协调创新运用。原创 2025-02-21 08:00:00 · 1780 阅读 · 39 评论 -
DeepSeek应用场景深度挖掘:多领域的智慧赋能
本文详细介绍了DeepSeek在自然语言处理、代码相关应用以及其他领域的多种应用场景。通过这些应用,我们可以看到DeepSeek在不同领域都发挥着重要作用,为各行业的发展提供了强大的技术支持。随着技术的不断发展,DeepSeek的应用场景还将不断拓展和深化,为人们的生活和工作带来更多的便利和创新。在后续的文章中,我们将进一步探讨如何通过优化提示词等方式,更好地发挥DeepSeek在这些应用场景中的作用。原创 2025-02-20 08:00:00 · 1480 阅读 · 3 评论 -
DeepSeek操作指南:基础操作与应用初体验
本文详细介绍了DeepSeek的界面操作,包括深度思考R1和联网搜索按钮、上传附件功能以及边栏的使用;深入讲解了基本操作技巧,如提示语的运用和文件处理操作;并通过文本生成和代码生成的实践案例,让大家初步体验了DeepSeek在不同任务中的应用。掌握这些基础内容,能帮助大家更好地与DeepSeek进行交互,为进一步探索DeepSeek的强大功能奠定坚实基础。原创 2025-02-19 08:00:00 · 1081 阅读 · 1 评论 -
DeepSeek深度揭秘:从基础认知到技术核心剖析
本文全面介绍了DeepSeek的公司概况,包括其成立背景、发展历程以及在AI领域的定位和影响力。深入剖析了DeepSeek-R1模型的架构、训练方式和性能优势,同时为新手提供了获取和使用DeepSeek-R1的方法以及有效的使用技巧。下一篇文章,我们将聚焦于 DeepSeek 的操作使用。会详细介绍DeepSeek 界面操作,以及如何与它进行交互,如输入指令的规范和技巧、处理文件的操作步骤等基本操作技巧。原创 2025-02-18 08:00:00 · 1704 阅读 · 39 评论 -
DeepSeek 凭什么让全球车企、开发者疯狂追捧?一文读懂技术内核与应用场景
DeepSeek 的崛起是中国 AI 发展历程中的一座重要里程碑,标志着中国 AI 从过去的 “跟跑” 阶段成功迈向 “领跑” 行列。正如其创始团队所言:“AI 不会淘汰人类,但会用 AI 的人将淘汰不会用 AI 的人。” 在这个 AI 技术飞速发展的时代,无论是开发者、创业者,还是普通用户,都应紧紧抓住 DeepSeek 带来的发展机遇,积极学习和应用这一强大的技术,因为这或许就是开启下一个时代大门的关键钥匙,让我们共同期待 DeepSeek 在未来创造更多的辉煌,引领 AI 技术走向更加美好的明天。原创 2025-02-17 08:00:00 · 1143 阅读 · 6 评论