自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(706)
  • 收藏
  • 关注

原创 盘点国产十大最实用的AI大模型!(深度解析)

在这个由数据驱动的时代,人工智能(AI)已经成为推动世界进步的超级引擎。从日常的语音助手到复杂的医疗诊断,AI的应用无处不在,它的影响力正以前所未有的速度扩展。今天我们来聊聊那些国产的AI大模型,深度盘点一下国产最实用的十大AI大模型百度文心大模型包含NLP(自然语言处理)、CV(计算机视觉)和跨模态大模型。在自然语言处理领域,文心ERNIE系列模型具有强大的小样本学习能力和基本推理能力。在计算机视觉领域,百度提出了基于视觉掩码技术的文心VIMER-CAE,具有强大的图像分割能力。

2024-12-10 14:08:23 7819

原创 我们为什么要用本地大模型?——坤叔的本地大模型入门指南

大模型,在2023年主要称之为大型语言模型(Large Language Models),是一种基于人工智能和机器学习技术构建的先进模型,旨在理解和生成自然语言文本。这些模型通过分析和学习海量的文本数据,掌握语言的结构、语法、语义和上下文等复杂特性,从而能够执行各种语言相关的任务。LLM的能力包括但不限于文本生成、问答、文本摘要、翻译、情感分析等。我们最熟悉的大模型,莫过于CHATGPT。但我们最常用的大模型,未必是CHATGPT。

2024-05-23 10:52:45 9773

原创 值得收藏!十大中国流行的AI大模型企业及平台汇总

在当今这个信息化迅速发展的时代,人工智能技术已经成为推动社会进步的重要力量。特别是在我国,AI大模型技术的发展速度令人瞩目,各种平台纷纷涌现,表现出强大的技术实力和广泛的应用前景。

2024-05-16 13:37:12 9359

原创 一文读懂 LLM 训练:从预训练到微调【大模型行业应用入门系列】

LLM Training 是指大型语言模型(LLM)的训练过程。作为一种采用超大规模数据进行预训练的深度学习模型,LLM 训练目标是培养出一个能够理解和生成自然语言文本的模型。在这个过程中,LLM 通过处理海量文本数据来学习语言的规律、语义和上下文关系等训练方式,可以获得丰富的语言知识和智能,从而使得能够自动理解和生成人类语言。通常而言,这种训练过程通常需要大量的计算资源和时间,以便模型能够充分地学习语言的各个方面。

2024-04-16 15:39:20 7252

原创 全民AI时代:手把手教你用Ollama & AnythingLLM搭建AI知识库,无需编程,跟着做就行!

本地运行大模型耗资源,需要选择较小的模型作为基础模型。在终端中运行时可能会出现 CUDA 错误,表示显存不足,导致提供的端口失效。中文支持不够完善。3. 文中提到的技术软件工具有:Ollama、Chatbox、Open WebUI、向量数据库、嵌入模型、本地模型 Gemma、AnythingLLM。

2024-04-10 11:10:50 9375

原创 一文吃透多模态:多模态大模型的探索 五大研究方向与十大应用领域!

理想中的多模态大模型具备跨模态的泛化理解和生成能力,其更符合人类感知世界的方式,其或能进一步打开AI能力的上限。产业界也在积极探索多模态大模型可行的技术路径,在多模态领域“复刻”大语言模型的成功。但目前多模态大模型的技术栈也尚未收敛,多模态学习和跨模态对齐仍为技术难点,未来产业发展仍有无限可能。在大模型兴起之后,产业也试图在图像、视频、音频等更多模态领域复现“Scaling Law”的成功,继续实现大模型的“智能涌现”。• 薪资上浮10%-20%,覆盖更多高薪岗位,这是一个高需求、高待遇的热门方向和领域;

2024-04-07 18:30:11 7827

原创 别以为会调参就行!普通工程师与AI架构师的核心差距竟是……

本文将从底层设施到顶层应用,循序渐进地展开一张全链路实战路线图,帮助你从技术整合者进阶为 AI 系统架构师。

2025-07-04 10:49:16 524

原创 一文讲清楚大模型中8个关键词及原理:LLM、Transformer、GPT、Bert、预训练、微调、深度学习、Token

一文讲清楚大模型中8个关键词及原理:LLM、Transformer、GPT、Bert、预训练、微调、深度学习、Token

2025-07-04 10:47:06 652

原创 手把手教你用LangGraph搭建AI Agent(附详细代码),远比你想的更简单!

本文将分享这一经验,带你从零开始深入理解AI智能体,学会用LangGraph搭建自己的AI Agent。

2025-07-03 13:41:02 828

原创 【AI产品经理必看】项目落地不知道用什么大模型?四张王牌教你技术选型

于是我今天就用最接地气的方式来介绍大模型的【四张“王牌”技术】。一招教你实现行业应用高效落地。

2025-07-03 12:01:12 892

原创 六大模式全面解析:如何为你的大模型应用选择最佳架构?

随着大模型(如 GPT-4、BERT、GPT-3.5 等)在自然语言处理、图像识别、医疗诊断等领域的广泛应用,如何构建高效、灵活的架构来支持大模型在复杂场景下的应用变得至关重要。本文将详细介绍几种常见的大模型应用架构设计模式,包括路由分发架构、大模型代理架构、基于缓存的微调架构、面向目标的 Agent 架构、Agent 智能体组合架构以及双重安全架构设计模式。

2025-07-02 13:43:33 1114

原创 AI应用开发先了解这些概念:智能体、LLM、RAG、提示词工程

一种基于LLM(LargeLanguage Model)的能够感知环境、做出决策并执行行动以实现特定目标的自主系统。与传统人工智能不同,Al Agent 模仿人类行为模式解决问题,通过独立思考和调用工具逐步完成给定目标,实现自主操作。

2025-07-02 12:02:04 846

原创 卷起来了?AI大模型求职真相:我们扒了数百份招聘JD,发现了这些秘密!

这篇文章就发挥了一下我们技术人的‘刨根问底’精神,收集整理了近期来自BOSS直聘、智联招聘以及像腾讯、字节、华为、商汤这些大厂官网等渠道的上百份AI相关,特别是与大模型、AI Agent紧密相关的招聘信息(JD)。

2025-07-01 13:46:24 856

原创 一文搞清楚什么是AI Agent(智能体),看这一篇就够了!

AI智能体,也称为人工智能代理,是一种模拟人类智能行为的人工智能系统,其核心引擎通常是大模型(LLM)。AI智能体能够感知环境、做出决策和执行任务,以实现特定目标。

2025-07-01 13:41:42 798

原创 100 个 AI 领域常见概念解析 | KG、RAG、KAG、GraphRAG… 它们的差异究竟在哪?

这个系列的灵感来源于我偶然间看到的“歪门邪道”——大意是如何伪装成一个陌生领域的专家?可以先了解这个领域常见的100个概念,并厘清其中的关系、上下位概念、区别和联系,然后在合适的场合灵活运用,就能骗到和你一样不懂的人了()虽然是一句玩笑,不过后来又想到,传统的人文社科考试似乎真的是考名词解释和名词解释Plus…

2025-06-30 14:52:07 551

原创 DeepSeek私有化部署选型考虑:模型参数、运行参数、算力硬件、配套生态及软件栈 (建议收藏)

私有化部署方案的选型考虑包括模型参数、运行参数、算力硬件、配套生态及软件栈支持等。首先需要根据企业实际业务场景需求确定合适的模型参数和运行参数,再基于推理性能、并发需求和投入成本等多维度考虑确定算力硬件,同时也需要重点考量 AI 计算卡的配套生态和软件栈支持。

2025-06-30 14:17:41 1852

原创 一文通晓:AI 概念从零基础到精通的 36 个核心术语指南

随着AI的普及和快速发展,越来越多的人开始关注AI,但是深奥晦涩的专业术语,让很多人望而却步,甚至对于人们应用AI产生了一定困难。因此,社区决定对AI领域的热点概念和专业术语进行解读,并配备相应图表以便于大家更形象的理解。我们将从七大方面进行深度解读,方便大家能够更好的进入该领域学习和应用。

2025-06-28 15:09:50 917

原创 大模型私有部署的最优解:构建企业级大模型统一能力底座

企业在推进AI大模型私有化部署时,往往会陷入从算力选型适配到系统配置的多重困境,真正限制落地效率的并非单一技术点,而是多环节间的耦合与不确定性,构建企业级大模型统一能力平台针对这一全链条复杂性,提供平台化解耦方案,可以帮助企业缩短部署周期,降低尝试门槛。

2025-06-28 15:07:08 802

原创 28岁Java到AI大模型,10000小时后,走进字节跳动拿了offer

2025年3月,我有幸成为了字节跳动的一名大模型算法工程师,正如标题所说,我从Java程序员到AI大模型,10000小时后,走进字节跳动拿下了offer。相信同行都清楚,进大厂有多难,运气之余,也离不开我自己的脚踏实地,所幸每踏出的一步都留下了厚厚的脚印。

2025-06-27 11:48:28 879

原创 地表最好用的全能AI助手——CherryStudio,保姆级使用教程!

地表最好用的全能AI助手——CherryStudio,保姆级使用教程!

2025-06-27 11:43:39 1465

原创 大模型学习必备:100个AI大模型基础概念(收藏版)

本文将从基础概念、核心技术、数据处理、训练方法、评估体系、应用场景、伦理安全等多个维度,系统阐述100个AI大模型的关键基础知识,帮助读者全面理解这一前沿技术领域。

2025-06-26 11:17:17 1139

原创 为什么网上的大模型那么多,很多人还要部署本地版?(含部署教程)

DeepSeek开源后,很多企业以及个人都开始部署本地模型。也许你会有疑问,为什么官方已经有了,还需要自己私域部署干嘛,直接用不好吗?

2025-06-26 11:10:45 847

原创 从新手到行家:提示词工程的深度剖析 ——Prompt 的基础原理与准则

GPT在处理Prompt时,GPT模型将输入的文本(也就是Prompt)转换为一系列的词向量。 然后,模型通过自回归生成过程逐个生成回答中的词汇。在生成每个词时,模型会基于输入的Prompt以及前面生成的所有词来进行预测。

2025-06-25 14:10:59 854

原创 18种RAG技术大比拼:谁才是检索增强生成的最佳选择?

在当今信息爆炸的时代,如何从海量数据中快速准确地获取所需信息,是人工智能领域的一大挑战。Retrieval-Augmented Generation(RAG,检索增强生成)技术应运而生,它结合了检索和生成的优势,通过从大量文档中检索相关信息,再利用这些信息生成高质量的回答。然而,RAG 的实现方式多种多样,不同的技术路径有着不同的优势和局限。今天,我们就来深入探讨一下这些 RAG 技术,看看谁才是真正的“最佳选手”。

2025-06-25 13:46:30 930

原创 雷军花千万抢人背后,第一批 AI 毕业生现状曝光:有人年薪200万,有人失业.....

猎聘《2025 AI 技术人才供需洞察报告》显示,30.97% 的 AI 技术岗位年薪超 50 万,顶尖人才年薪可达 200 万。

2025-06-24 11:30:32 786

原创 【科普】什么是大(语言)模型,一文讲清楚大模型和小模型的区别!

在人工智能飞速发展的当下,大语言模型成为行业焦点。它凭借强大能力革新着诸多领域,而小模型也在特定场景发挥作用。二者有何特性?又存在哪些差异?让我们一同深入探究。

2025-06-24 11:24:48 517

原创 AI智能体创业,一定要搞清楚这100个问题清单(建议收藏)

做 AI 智能体创业,尤其是 toC,你是不是也有这些困惑?

2025-06-23 13:53:36 1175

原创 RAGFlow是什么?一文读懂RAGFlow,从 0 到 1教你搭建RAG知识库

最近随着Deepseek的火爆,如何高效地整合海量数据与生成式模型成为了技术领域内的一大热点。传统的生成模型在回答复杂问题时常常依赖于预训练数据的广度与深度,而检索增强生成(Retrieval-Augmented Generation,简称RAG)则有效结合了检索与生成的优势,为各类应用场景提供了更为灵活、高效的解决方案。

2025-06-23 13:40:09 1794

原创 零基础到大模型高手:看我如何从0到1训练大语言模型

大语言模型(后续简称大模型)可以看作是一种强大的计算机程序或者应用,它能够处理复杂的任务,比如理解和生成语言、识别图像、翻译文本等。

2025-06-21 14:07:56 643

原创 文科转型怎么成功?看我如何靠这招搭上时代快车,实现职业逆袭!

文科转型怎么成功?看我如何靠这招搭上时代快车,实现职业逆袭!

2025-06-21 14:03:20 488

原创 想入门大语言模型,一文给你讲清楚该怎么开始学习!

想要学习LLM(大型语言模型),首先要对LLM有一定的了解,知道LLM的基本概念和使用。因此,对于每一位初学者,首先都需要学习一些LLM的入门课程,包括基础的 Python 语法(因为 LLM 目前基本都建立在Python生态上)、LLM 的概念、Prompt 书写技巧等,对 LLM 有一个初步而全面的了解。

2025-06-20 14:37:47 697

原创 年薪98w!400万人才缺口,真心建议产品人冲一冲新兴领域!

如今AI大火,现在63%的企业都在做AI产品!行业发展的背后,是AI产品人才的严重稀缺!

2025-06-20 14:34:54 328

原创 DeepSeek 本地部署安装指南,傻瓜式安装配置步骤,解决一切问题

在 AI 大语言模型的激烈竞争中,DeepSeek 脱颖而出,以其强大的自然语言处理能力、出色的代码生成效果和流畅的多轮对话表现,成为众多 AI 爱好者和开发者的心头好。但用户在线使用时频繁遭遇到服务器繁忙的问题,而本地部署能有效解决这一困扰。接下来,让我们一起来探究DeepSeek如何进行本地部署,对比网络版又有什么差别。

2025-06-19 13:56:31 726

原创 【Dify工作流教程】以电费单分析为例详细讲解工作流编排过程

某全国性售电公司正面临业务数据治理的重大挑战。该公司采集的客户电费单覆盖全国多个省级行政单位,年均处理量超过2万份。这些原始数据呈现出显著的多模态特征。

2025-06-19 13:52:10 662

原创 【2025最全面】人工智能学习路线:适合新手与大学生的完整指南,看这一篇就够了!

现在人工智能可以说是非常的火热,很多同学也想学习。但刚开始时总会觉得比较迷茫,不知道如何开始学,也担心人工智能太难,自己可能学不会。所以今天这篇文章对如何去学习人工智能,给出一份学习路线。

2025-06-18 13:49:52 1289

原创 2025年,DeepSeek关于发财的方法和创业十大黄金赛道建议(理性靠谱)

DeepSeek在全球范围内迅速打开局面,其推出的人工智能助手展现出强劲实力,大有超越OpenAI旗下ChatGPT的态势。该助手不仅在竞争激烈的美国苹果应用商店中登上榜首,还收获了众多名人的热烈评价。

2025-06-18 13:44:51 24487

原创 从入门到精通:提示词工程深度解析,看这一篇就够了!

在使用提示词与大语言模型交互时的一些常见设置,包括温度(Temperature)、Top_p、最大长度(Max Length)、停止序列(Stop Sequences)、频率惩罚(Frequency Penalty)和存在惩罚(Presence Penalty)等参数的作用及调整建议,同时提醒最终结果可能因大语言模型版本而异。

2025-06-17 13:49:27 1204

原创 n8n、Dify、Coze深度测评:从0到1选对AI自动化平台,避开99%的坑

本文深度拆解三大主流工具——n8n、Dify、Coze,从技术架构、核心优势、适用场景、实战案例等八大维度精准对比,助你避开99%的选择坑。

2025-06-17 12:11:22 1106

原创 一文彻底搞懂大模型 - Dify(Agent + RAG),看这一篇就够了!

Dify 是一个用于构建 AI 应用程序的开源平台。 Dify融合了后端即服务(Backend as Service)和LLMOps理念。它支持多种大型语言模型,如Claude3、OpenAI等,并与多个模型供应商合作,确保开发者能根据需求选择最适合的模型。Dify通过提供强大的数据集管理功能、可视化的Prompt编排以及应用运营工具,大大降低了AI应用开发的复杂度。

2025-06-16 14:45:32 849

原创 大模型10个核心概念,一文讲透(产品经理也能轻松看懂)

大模型到底是什么?它为什么这么火?对我们普通产品经理来说,有哪些必须掌握的底层概念?这篇文章不讲高深公式,只讲10个最关键、最常见、最容易搞混的核心概念,并通过真实场景举例帮助你彻底搞懂。

2025-06-16 14:39:57 1494

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除