deepseek大模型-CSDN博客

原创盘点国产十大最实用的AI大模型！（深度解析）

在这个由数据驱动的时代，人工智能（AI）已经成为推动世界进步的超级引擎。从日常的语音助手到复杂的医疗诊断，AI的应用无处不在，它的影响力正以前所未有的速度扩展。今天我们来聊聊那些国产的AI大模型，深度盘点一下国产最实用的十大AI大模型百度文心大模型包含NLP（自然语言处理）、CV（计算机视觉）和跨模态大模型。在自然语言处理领域，文心ERNIE系列模型具有强大的小样本学习能力和基本推理能力。在计算机视觉领域，百度提出了基于视觉掩码技术的文心VIMER-CAE，具有强大的图像分割能力。

2024-12-10 14:08:23 7856

原创我们为什么要用本地大模型？——坤叔的本地大模型入门指南

大模型，在2023年主要称之为大型语言模型（Large Language Models），是一种基于人工智能和机器学习技术构建的先进模型，旨在理解和生成自然语言文本。这些模型通过分析和学习海量的文本数据，掌握语言的结构、语法、语义和上下文等复杂特性，从而能够执行各种语言相关的任务。LLM的能力包括但不限于文本生成、问答、文本摘要、翻译、情感分析等。我们最熟悉的大模型，莫过于CHATGPT。但我们最常用的大模型，未必是CHATGPT。

2024-05-23 10:52:45 9898

原创值得收藏！十大中国流行的AI大模型企业及平台汇总

在当今这个信息化迅速发展的时代，人工智能技术已经成为推动社会进步的重要力量。特别是在我国，AI大模型技术的发展速度令人瞩目，各种平台纷纷涌现，表现出强大的技术实力和广泛的应用前景。

2024-05-16 13:37:12 9412

原创一文读懂 LLM 训练：从预训练到微调【大模型行业应用入门系列】

LLM Training 是指大型语言模型（LLM）的训练过程。作为一种采用超大规模数据进行预训练的深度学习模型，LLM 训练目标是培养出一个能够理解和生成自然语言文本的模型。在这个过程中，LLM 通过处理海量文本数据来学习语言的规律、语义和上下文关系等训练方式，可以获得丰富的语言知识和智能，从而使得能够自动理解和生成人类语言。通常而言，这种训练过程通常需要大量的计算资源和时间，以便模型能够充分地学习语言的各个方面。

2024-04-16 15:39:20 7323

原创全民AI时代：手把手教你用Ollama & AnythingLLM搭建AI知识库，无需编程，跟着做就行！

本地运行大模型耗资源，需要选择较小的模型作为基础模型。在终端中运行时可能会出现 CUDA 错误，表示显存不足，导致提供的端口失效。中文支持不够完善。3. 文中提到的技术软件工具有：Ollama、Chatbox、Open WebUI、向量数据库、嵌入模型、本地模型 Gemma、AnythingLLM。

2024-04-10 11:10:50 9407

原创一文吃透多模态：多模态大模型的探索五大研究方向与十大应用领域！

理想中的多模态大模型具备跨模态的泛化理解和生成能力，其更符合人类感知世界的方式，其或能进一步打开AI能力的上限。产业界也在积极探索多模态大模型可行的技术路径，在多模态领域“复刻”大语言模型的成功。但目前多模态大模型的技术栈也尚未收敛，多模态学习和跨模态对齐仍为技术难点，未来产业发展仍有无限可能。在大模型兴起之后，产业也试图在图像、视频、音频等更多模态领域复现“Scaling Law”的成功，继续实现大模型的“智能涌现”。• 薪资上浮10%-20%，覆盖更多高薪岗位，这是一个高需求、高待遇的热门方向和领域；

2024-04-07 18:30:11 7891

原创 2025 年 AI 产品经理学习指南：100 个核心知识点务必全掌握

2025 年 AI 产品经理学习指南：100 个核心知识点务必全掌握

2025-07-16 15:08:53 556

原创企业老板必读：MCP 落地实操指南，3 步助力 AI 效率提升 72%

企业老板必读：MCP 落地实操指南，3 步助力 AI 效率提升 72%

2025-07-16 15:04:01 613

原创深度解析：一文讲清楚企业级 Agent 分布式部署架构！（建议收藏）

在当今数字化时代，企业的 IT 系统规模日益庞大且复杂，如何高效地对其进行监控与管理成为关键难题。Agent 分布式部署架构应运而生，为企业提供了一种强大的解决方案。接下来，让我们深入探究这一架构的奥秘。

2025-07-15 15:38:31 713

原创一文读懂！AI 产品经理的核心职责与技能要求，你是否达标？

一文读懂！AI 产品经理的核心职责与技能要求，你是否达标？

2025-07-15 15:30:51 712

原创一文讲明白:AI Agent 智能体产品 5 个级别全解析,看这一篇就够了！

一文讲明白:AI Agent 智能体产品 5 个级别全解析,看这一篇就够了！

2025-07-14 15:06:50 1133

原创大（语言）模型是什么？一文看懂大模型和小模型的差异

大（语言）模型是什么？一文看懂大模型和小模型的差异

2025-07-14 15:03:31 1291

原创文科生也能逆袭 AI？零基础转行看这 5 个方向就够了！

随着 AI 技术的不断成熟与应用场景的日益丰富，一些岗位并非单纯依赖技术，反而更侧重于文科素养与技能，为文科生提供了转型的契机。接下来，我们就为大家详细剖析 5 个适合零基础文科生转行 AI 的方向。

2025-07-12 14:30:24 953

原创一文讲清楚大语言模型核心：Transformer 内部运行原理详解，看这一篇就够了！

一文讲清楚大语言模型核心：Transformer 内部运行原理详解，看这一篇就够了！

2025-07-12 14:22:02 797

原创 3 分钟看懂智能体（Agent）的 3 种表现形态：聊天助手、工作流与对话流，看这一篇就够了！

3 分钟看懂智能体（Agent）的 3 种表现形态：聊天助手、工作流与对话流，看这一篇就够了！

2025-07-11 15:27:25 682

原创【小白必看】提示词（Prompt）入门到精通教程：一篇搞定所有核心知识

【小白必看】提示词（Prompt）入门到精通教程：一篇搞定所有核心知识

2025-07-11 15:19:11 963

原创【干货分享】从 AI Agent 到 Agent 工作流，一文读懂代理工作流 (Agentic Workflows)

今天，让我们一同深入解析代理型 AI 的关键概念 —— 代理工作流（Agentic Workflows）。

2025-07-10 14:17:50 1003

原创一文吃透医学基础模型：全面了解医学大模型到底是什么？

那么，医学基础模型究竟是什么？它又将如何改变我们的医疗现状呢？接下来，让我们一同深入探索医学基础模型的世界。

2025-07-10 14:03:30 643

原创一文读懂：大模型精调、SFT、DPO、PPO、RL 到底是什么？

一文读懂：大模型精调、SFT、DPO、PPO、RL 到底是什么？

2025-07-09 14:43:40 999

原创一文读懂：AI 产品经理的核心职责与技能要求，你是否达标？

AI 产品经理的核心职责究竟有哪些？又需要具备怎样的技能要求？你是否已经达标了呢？接下来，让我们一同深入探讨。

2025-07-09 14:29:25 1022

原创干货分享 | 一篇文章搞定 AI 大模型面试！TOP 60问题及答案请收好

在当下，AI 大模型已然成为科技领域的焦点，其影响力正迅速渗透到各个行业，从自然语言处理到计算机视觉，从医疗健康到金融服务，无所不在。如果你正准备踏入这个充满机遇与挑战的领域，一场充分准备的面试至关重要。这里精心整理了 TOP 60 AI 大模型面试问题及答案，助你一臂之力。

2025-07-08 15:13:13 1105

原创大白话讲RAG是什么？一文搞懂RAG的工作原理，看这一篇就够了!

大白话讲RAG是什么？一文搞懂RAG的工作原理，看这一篇就够了!

2025-07-08 14:58:45 473

原创突破困境：RAG-MCP 新架构破解大模型提示词膨胀的工具选择问题

RAG-MCP 是一种“检索增强生成”的方法。它通过提前筛选出最相关的工具来解决这个问题。具体来说，在调用大语言模型之前，RAG-MCP 会先用语义检索技术，从外部的索引中找出和当前查询最相关的 MCP 工具。只有这些被选中的工具描述才会被传递给大语言模型。这样一来，提示词的长度大幅减少，决策过程也变得更加简单。

2025-07-07 14:21:38 844

原创一文搞懂大模型的预训练Pre-training：智能的诞生，看这一篇就够了!

一文搞懂大模型的预训练Pre-training：智能的诞生，看这一篇就够了!

2025-07-07 14:12:42 1392

原创【大模型面试】50道大型语言模型（LLM）面试题，2025面试者必备！

这份为人工智能爱好者和准备面试的专业算法工程师精心制作的综合指南，了解大型语言模型（LLMs）的关键概念、技术和挑战。也适合刚毕业CS及相关专业找工作之用。

2025-07-06 10:00:00 859

原创一文搞懂AI大模型三种模式：Agent、copilot、embedding讲清楚了！

今天来和大家讲讲AI大模型的三种模式：agent、copilot、embedding

2025-07-06 09:00:00 969

原创别以为会调参就行！普通工程师与AI架构师的核心差距竟是……

本文将从底层设施到顶层应用，循序渐进地展开一张全链路实战路线图，帮助你从技术整合者进阶为 AI 系统架构师。

2025-07-04 10:49:16 854

原创一文讲清楚大模型中8个关键词及原理：LLM、Transformer、GPT、Bert、预训练、微调、深度学习、Token

一文讲清楚大模型中8个关键词及原理：LLM、Transformer、GPT、Bert、预训练、微调、深度学习、Token

2025-07-04 10:47:06 939

原创手把手教你用LangGraph搭建AI Agent（附详细代码），远比你想的更简单！

本文将分享这一经验，带你从零开始深入理解AI智能体，学会用LangGraph搭建自己的AI Agent。

2025-07-03 13:41:02 1025

原创【AI产品经理必看】项目落地不知道用什么大模型？四张王牌教你技术选型

于是我今天就用最接地气的方式来介绍大模型的【四张“王牌”技术】。一招教你实现行业应用高效落地。

2025-07-03 12:01:12 1017

原创六大模式全面解析：如何为你的大模型应用选择最佳架构？

随着大模型（如 GPT-4、BERT、GPT-3.5 等）在自然语言处理、图像识别、医疗诊断等领域的广泛应用，如何构建高效、灵活的架构来支持大模型在复杂场景下的应用变得至关重要。本文将详细介绍几种常见的大模型应用架构设计模式，包括路由分发架构、大模型代理架构、基于缓存的微调架构、面向目标的 Agent 架构、Agent 智能体组合架构以及双重安全架构设计模式。

2025-07-02 13:43:33 1166

原创 AI应用开发先了解这些概念：智能体、LLM、RAG、提示词工程

一种基于LLM（LargeLanguage Model）的能够感知环境、做出决策并执行行动以实现特定目标的自主系统。与传统人工智能不同，Al Agent 模仿人类行为模式解决问题，通过独立思考和调用工具逐步完成给定目标，实现自主操作。

2025-07-02 12:02:04 869

原创卷起来了？AI大模型求职真相：我们扒了数百份招聘JD，发现了这些秘密！

这篇文章就发挥了一下我们技术人的‘刨根问底’精神，收集整理了近期来自BOSS直聘、智联招聘以及像腾讯、字节、华为、商汤这些大厂官网等渠道的上百份AI相关，特别是与大模型、AI Agent紧密相关的招聘信息（JD）。

2025-07-01 13:46:24 876

原创一文搞清楚什么是AI Agent（智能体），看这一篇就够了！

AI智能体，也称为人工智能代理，是一种模拟人类智能行为的人工智能系统，其核心引擎通常是大模型（LLM）。AI智能体能够感知环境、做出决策和执行任务，以实现特定目标。

2025-07-01 13:41:42 878

原创 100 个 AI 领域常见概念解析 | KG、RAG、KAG、GraphRAG… 它们的差异究竟在哪？

这个系列的灵感来源于我偶然间看到的“歪门邪道”——大意是如何伪装成一个陌生领域的专家？可以先了解这个领域常见的100个概念，并厘清其中的关系、上下位概念、区别和联系，然后在合适的场合灵活运用，就能骗到和你一样不懂的人了（）虽然是一句玩笑，不过后来又想到，传统的人文社科考试似乎真的是考名词解释和名词解释Plus…

2025-06-30 14:52:07 565

原创 DeepSeek私有化部署选型考虑：模型参数、运行参数、算力硬件、配套生态及软件栈 (建议收藏)

私有化部署方案的选型考虑包括模型参数、运行参数、算力硬件、配套生态及软件栈支持等。首先需要根据企业实际业务场景需求确定合适的模型参数和运行参数，再基于推理性能、并发需求和投入成本等多维度考虑确定算力硬件，同时也需要重点考量 AI 计算卡的配套生态和软件栈支持。

2025-06-30 14:17:41 1881

原创一文通晓：AI 概念从零基础到精通的 36 个核心术语指南

随着AI的普及和快速发展，越来越多的人开始关注AI，但是深奥晦涩的专业术语，让很多人望而却步，甚至对于人们应用AI产生了一定困难。因此，社区决定对AI领域的热点概念和专业术语进行解读，并配备相应图表以便于大家更形象的理解。我们将从七大方面进行深度解读，方便大家能够更好的进入该领域学习和应用。

2025-06-28 15:09:50 966

原创大模型私有部署的最优解：构建企业级大模型统一能力底座

企业在推进AI大模型私有化部署时，往往会陷入从算力选型适配到系统配置的多重困境，真正限制落地效率的并非单一技术点，而是多环节间的耦合与不确定性，构建企业级大模型统一能力平台针对这一全链条复杂性，提供平台化解耦方案，可以帮助企业缩短部署周期，降低尝试门槛。

2025-06-28 15:07:08 815

原创 28岁Java到AI大模型，10000小时后，走进字节跳动拿了offer

2025年3月，我有幸成为了字节跳动的一名大模型算法工程师，正如标题所说，我从Java程序员到AI大模型，10000小时后，走进字节跳动拿下了offer。相信同行都清楚，进大厂有多难，运气之余，也离不开我自己的脚踏实地，所幸每踏出的一步都留下了厚厚的脚印。

2025-06-27 11:48:28 890

原创地表最好用的全能AI助手——CherryStudio，保姆级使用教程！

地表最好用的全能AI助手——CherryStudio，保姆级使用教程！

2025-06-27 11:43:39 2184

空空如也

空空如也