自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(647)
  • 收藏
  • 关注

原创 【大模型入门必看】八本高评分书籍,大家都在读!

在AI技术日新月异的时代,掌握大模型开发与应用的技能已成为科研人员与工程师的必备能力。本文为读者精心挑选了8本高评分的书籍,从基础理论到实际操作,为不同层次的学习者提供了全面的学习资源。这些书籍包括对PyTorch深度学习、LLM构建、AIGC基础、大模型应用和技术演进的深入解读,助力读者在大模型时代顺利前行。

2025-05-06 11:13:27 624

原创 Llama 3.1部署教程(非常详细)从零基础入门到精通,看完这一篇就够了

Meta公司发布了人工智能模型——Llama 3.1。那么Llama 3.1 405B的效果怎么样?我们来对比一张图,横向对比一下GPT-4。可以看出,Llama 3.1 405B在各类任务中的表现可以与GPT-4等顶级的模型相差无几。那么,我们怎样才能用到这款强大的Llama 3.1 405B模型呢?最直接的方式是通过Meta.ai平台,但目前这一途径仅对美丽国的用户开放。那有无适合平民用的大模型嘞。接下来我们将在本地部署Llama 3.1 8B(环境所迫)1.环境准备。

2025-05-06 11:10:30 547

原创 2025最新AI大模型学习路线:(非常详细)AI大模型学习路线,收藏这一篇就够了!

在大模型时代,我们如何有效的去学习大模型?现如今大模型岗位需求越来越大,但是相关岗位人才难求,薪资持续走高,AI运营薪资平均值约18457元,AI工程师薪资平均值约37336元,大模型算法薪资平均值约39607元。掌握大模型技术你还能拥有更多可能性• 成为一名全栈大模型工程师,包括Prompt,LangChain,LoRA等技术开发、运营、产品等方向全栈工程;• 能够拥有模型二次训练和微调能力,带领大家完成智能对话、文生图等热门应用;

2025-05-06 11:01:25 705

原创 RAG技术解剖:3大模块根治AI“幻觉“

RAG(Retrieval Augmented Generation,检索增强生成)是一种将检索系统与生成式AI模型结合的技术架构。不要让模型凭空生成答案,而是先检索相关信息,再基于检索到的信息生成回答。RAG技术通过将检索系统与生成式AI模型结合,有效解决了大模型的知识时效性、专业领域知识缺乏、幻觉和可溯源性等问题。它为构建可靠、准确、透明的AI应用提供了强大支持。对于我们技术开发者来说,掌握RAG不仅是学习一项技术,更是培养一种思维方式——如何让AI系统更加开放、透明、可控和可信。

2025-05-06 10:59:34 538

原创 一个很恶心,但能让你6周学透大模型的方法!

今天给大家推荐一个很恶心,但,快速吃透大模型!!相信通过为期💪。

2025-05-01 10:30:00 100

原创 Dify 入门与工作流节点介绍

Dify 是一款开源的大语言模型(LLM) 应用开发平台。它融合了后端即服务(Backend as Service)和 LLMOps 的理念,使开发者可以快速搭建生产级的生成式 AI 应用。即使你是非技术人员,也能参与到 AI 应用的定义和数据运营过程中。由于 Dify 内置了构建 LLM 应用所需的关键技术栈,包括对数百个模型的支持、直观的 Prompt 编排界面、高质量的 RAG 引擎、稳健的 Agent 框架、灵活的流程编排,并同时提供了一套易用的界面和 API。

2025-04-23 22:10:13 1126

原创 上海交通大学力作!《动手学大模型》实战教程+PPT分享!

今天与大家分享一个由上海交通大学提供的珍贵资源——一套免费的大模型课程。,其受欢迎程度可见一斑,而且它还包含了全面的教程文档和精心制作的Slides,可以说在AI圈特热度很高了。《动手学大模型》是一套实践性极强的编程教程,它源自于,由知名专家精心设计。本教程的目标是提供一个深入浅出的大模型编程入门参考,通过一系列精心设计的实践案例,帮助有志于该领域的研究者迅速把握大模型的核心概念,并在课程设计和学术研究中发挥其潜力。特别推荐这套教程给那些希望在人工智能领域取得突破的研究者和学生。

2025-04-23 21:56:39 371

原创 为什么一定要做Agent智能体?

最近一直在从事Agent智能体相关的工作,主要是聚焦在阿里云客户服务领域,。我们团队近一年多的时间一直在服务领域持续构建、深耕Agent能力,在这方面我本人也投入了大量的精力。或者换句话说,提出这个问题的人也挺多的,其实逻辑也并不复杂:同样的业务场景,使用Agent无非就是构建了一个基于大模型按多步骤执行的流程,如果通过传统的开发方法,如,其实也同样能实现类似Agent的流程功能。

2025-04-22 22:41:08 723

原创 DeepSeek、Manus与AI+Agent行业现状报告|附52页文件下载

1、DeepSeek等推理模型对Al Agent的影响。2、Manus通用智能体带来的行业启示。3、AlAgent行业现状。4、AlAgent对如何影响企业经营。

2025-04-22 22:38:25 320

原创 【大模型科普】智能体Agent的五种交互模式

octave如果你是零基础小白,想快速入门大模型是可以考虑的。一方面是学习时间相对较短,学习内容更全面更集中。二方面是可以根据这些资料规划好学习计划和方向。包括:大模型学习线路汇总、学习阶段,大模型实战案例,大模型学习视频,人工智能、机器学习、大模型书籍PDF。带你从零基础系统性的学好大模型!😝有需要的小伙伴,可以保存图片到免费领取【保证100%免费】🆓。

2025-04-17 19:27:14 750

原创 给大家普及一下学大模型需要达到的学习强度

无论您是科研人员、工程师,还是对AI大模型感兴趣的爱好者,这套报告合集都将为您提供宝贵的信息和启示。现如今大模型岗位需求越来越大,但是相关岗位人才难求,薪资持续走高,AI运营薪资平均值约18457元,AI工程师薪资平均值约37336元,大模型算法薪资平均值约39607元。很多人学习大模型的时候没有方向,东学一点西学一点,像只无头苍蝇乱撞,下面是我整理好的一套完整的学习路线,希望能够帮助到你们学习AI大模型。第七阶段: 以大模型平台应用与开发为主,通过星火大模型,文心大模型等成熟大模型构建大模型行业应用。

2025-04-17 19:23:34 1099

原创 大模型应用之RAG详解,RAG保姆级教程,收藏这篇就够了!_rag大模型

RAG(Retrieval Augmented Generation,检索增强生成)技术最初源于2020年Facebook的一篇论文——《Retrieval-Augmented Generation for Knowledge-Intensive NLP Tasks》。是的,2020年就已经提出了这项技术。这篇论文要解决的一个问题非常简单:如何让大语言模型使用外部知识进行生成。通常,预训练模型的知识是存储在参数中的,因此模型无法了解训练集之外的知识(例如搜索数据、行业知识)。

2025-04-16 22:15:49 954

原创 全网爆火神书《从零构建大模型》分享,一本书刚发布,就拿下33.2k个star?

从零构建大模型》是一本即将于今年10月底发布的书籍,github已经吸引了惊人的21.7k标星!作者是威斯康星大学麦迪逊分校的终身教授,在GitHub、油管、X上拥有大量粉丝,是一位真正的大佬。

2025-04-16 22:09:58 520

原创 手把手教你用 DeepSeek + CherryStudio 打造本地知识库

CherryStudio 是一款支持多个模型提供方的客户端软件,最近雨飞也是一直在使用它,但是很多人只是用来进行简单的对话。其实 Cherry Studio 还可以用来搭建简易的本地知识库,今天就教大家如何使用和搭建这个知识库。官方网站:https://cherry-ai.com/安装过程非常简单,直接参考下方教程。1、配置硅基流动的模型服务和 API 密钥这一步可以参考文章:[全网首发,硅基流动 X 华为云,提供 DeepSeek R1 API 推理服务]2、配置模型。

2025-04-12 13:12:35 1061

原创 2025最新大模型常见面试题汇总(含答案),面试还得八股文,不背不行啊,非常详细收藏我这一篇就够了!

最近春招正在如火如荼地进行中,看到很多人的简历上都包含大模型相关的工作,各家大厂和初创都很舍得给钱,动辄百万年包也变得不再稀奇。因此在大模型纵横的这个时代,不仅大模型技术越来越卷,就连大模型相关的岗位和面试也开始越来越卷了。本文汇总了1、目前主流的开源模型体系有哪些?Transformer体系:由Google提出的Transformer 模型及其变体,如BERT、GPT 等。PyTorch Lightning:一个基于PyTorch的轻量级深度学习框架,用于快速原型设计和实验。

2025-04-12 13:09:45 1401

原创 Dify x DeepSeek:轻松部署私有化 AI 助手,搭建本地 DeepSeek R1+ 联网搜索 App_dify联网

如需切换访问端口,请参考此文档:https://docs.dify.ai/zh-hans/getting-started/install-self-hosted/faq#id-5.-ru-he-xiu-gai-ye-mian-duan-kou。通过私有化部署,你可以完全掌控数据的安全性,并根据自己的需求灵活调整部署方案,打造专属于你的。在实际应用中,当你上传内部文档或专业资料后, Dify 的知识库功能可以承担起 RAG 作用,帮助 LLM 基于专业资料提供更有针对性的解答,有效弥补模型训练数据的不足。

2025-04-11 21:29:19 934

原创 2025大模型新书分享《大模型入门:技术原理与实战应用》文末PDF共享

本书深入探讨大模型技术及其应用的书籍,特别聚焦于提示工程这一新兴领域。本书揭示了大模型的工作原理,展示了如何通过精心设计的提示引导大模型产出高质量内容,涵盖了从电子商务、创意营销到内容创作、智能办公、编程和软件生态等多个领域的实践案例,为读者提供了一个全面的技术科普和操作指南,帮助读者掌握与大模型高效协作的方法,挖掘大模型潜力,解决实际问题。

2025-04-11 21:27:31 956

原创 RAGFlow与Dify的关系

RAGFlow与Dify是两款定位互补的AI开发工具,两者既有差异化的核心能力,又可通过整合形成更强大的解决方案。

2025-04-09 21:46:28 909

原创 瞬间对大模型的喜爱程度达到了1000000000%

从大模型时代开发者的基础技能出发,深入浅出地介绍了如何基于大模型 API、LangChain 架构快速开发结合大模型强大能力的应用。它不仅提供了深入的理论知识,而且还通过实践指导,帮助开发者将LLM技术应用于实际问题中。👩🏻‍💻宝子们,今天必须给大家安利一本超实用的书——第二部分 搭建基于 ChatGPT 的问答系统。第九章 评估(上)——存在一个简单的正确答案。第十章 评估(下)——不存在简单的正确答案。第八章 搭建一个带评估的端到端问答系统。第五章 处理输入-思维链推理。第三章 评估输入——分类。

2025-04-07 23:05:50 348

原创 Meta推出Llama 4:MoE构架、原生多模态、10M上下文,没有发布推理模型

这次Llama 4的推理模型还不见踪影,这多少有点说不过去,大家觉得呢?毕竟Meta也是妥妥的大厂啊!不过Meta 表示这只是开始,后续还有更多模型,团队正在全力开发中,特别提到了。

2025-04-07 22:34:58 800

原创 零基础学AI大模型要多久?真的能学会吗?_训练一个ai模型要多久

随着人工智能技术的迅猛发展,AI大模型成为了当前最热门的技术领域之一。很多人对AI大模型既充满好奇又感到陌生,特别是对于那些完全没有编程基础的人来说,从零开始学习AI大模型似乎是一项艰巨的任务。但实际上,只要有足够的决心和正确的方法,任何人都有可能成为AI大模型领域的专家。本文将探讨从零基础学习AI大模型需要多长时间,以及如何确保你能够真正学会。

2025-03-28 23:01:13 986

原创 AI大模型实战系列:电动汽车充电行为大模型智能体框架解读_微调大语言预测电动汽车

随着电动车(EVs)变得更加流行,它们大规模融入电网带来了新的挑战和机遇。EV的充电行为对电网有着显著影响,因为它涉及大幅度的功率需求波动,影响电力系统的稳定性和经济效率[1]。

2025-03-28 22:59:36 841

原创 RAG+AI工作流+Agent:全面对比MaxKB、Dify、FastGPT、RagFlow、Anything-LLM_ragflow和dify的比较

开箱即用:支持直接上传文档、自动爬取在线文档,支持文本自动拆分、向量化、RAG(检索增强生成),智能问答交互体验好;无缝嵌入:支持零编码快速嵌入到第三方业务系统,让已有系统快速拥有智能问答能力,提高用户满意度;灵活编排:内置强大的工作流引擎,支持编排 AI 工作流程,满足复杂业务场景下的需求;模型中立。

2025-03-28 22:55:14 820

原创 2025火爆全网的LLM大模型教程:从零开始构建大语言模型,git突破18K标星

什么!一本书的Github仓库居然有18.5k的星标!(这含金量不必多说)对GPT大模型感兴趣的有福了!这本书的名字叫也就是虽然这是一本英文书、而且还没正式出版,但是他真的可以帮你使用python从零构建一个自己的大模型!为了加强读者的动手能力,这本书主要使用的是框架,而不是依靠各种库。通过这种方法,加上大量的图表和插图让大家可以彻底了解llm的工作原理。

2025-03-24 22:59:10 1032

原创 【AI大模型】如何构建一个大模型?看完你就知道了!_ai大模型开发

这四个阶段都需要不同规模的数据集及不同类型的算法,会产出不同类型的模型,所需要的资源也有非常大的差别。图1 OpenAI 使用的大语言模型构建流程(Pretraining)阶段需要利用海量的训练数据(数据来自互联网网页、维基百科、书籍、GitHub、论文、问答网站等),构建包含数千亿甚至数万亿单词的具有多样性的内容。利用由数千块高性能 GPU 和高速网络组成的超级计算机,花费数十天完成深度神经网络参数训练,构建基础模型(Base Model)。

2025-03-24 22:51:21 830

原创 2025年最新AI大模型学习路线(非常详细)零基础入门到精通保姆级教程,收藏这一篇就够了!学完即就业!

大模型目前在人工智能领域可以说正处于一种“炙手可热”的状态,吸引了很多人的关注和兴趣,也有很多新人小白想要学习入门大模型,下面给大家分享一份2025最新版的大模型学习路线,帮助新人小白更系统、更快速的学习大模型!微信扫描下方二维码。

2025-03-23 12:57:06 895

原创 亲手复现DeepSeek-R1-Zero实验完整解读

本文给大家分享个人亲手复现R1-Zero的全过程,包括对关键源码的解读、训练过程和实验结果分析。TL;DR,整个项目只需要定制2处地方:另外在main_ppo.py训练入口中的注册该reward function即可。如果想定制训练自己的推理任务,只需要处理上述两处代码即可。又可以愉快地调包了 (:中途遇到问题:模型和数据基于Qwen2.5-3B复现。下载作者上传的数据集Jiayi-Pan/Countdown-Tasks-3to4。数据集包括target和nums两列。此处要注意,veRL框

2025-03-23 12:43:06 1045

原创 给GitHub排名No.1的LLM课程看跪了...

现如今大模型岗位需求越来越大,但是相关岗位人才难求,薪资持续走高,AI运营薪资平均值约18457元,AI工程师薪资平均值约37336元,大模型算法薪资平均值约39607元。很多人学习大模型的时候没有方向,东学一点西学一点,像只无头苍蝇乱撞,下面是我整理好的一套完整的学习路线,希望能够帮助到你们学习AI大模型。2、LLM科学家阶段:深入研究最新技术,学习LLM的训练和优化,涵盖预训练、微调、强化学习等全流程。第七阶段: 以大模型平台应用与开发为主,通过星火大模型,文心大模型等成熟大模型构建大模型行业应用。

2025-03-22 23:25:20 1014

原创 手把手教你如何用扣子(COZE)打造一个企业级的知识库机器人_扣子(coze)

大模型是由海量数据训练而成的人工智能模型,具备强大的学习和推理能力,能够理解和生成自然语言。智能体则是基于对话的AI项目,它接收用户的输入,通过大模型自动调用插件或执行工作流完成指定任务。智能客服、虚拟助手、英语外教等,都是智能体的典型应用场景。扣子(COZE)是字节旗下的新一代AI应用开发平台。无论你是否有编程基础,都可以在扣子上快速搭建基于大模型的各类AI应用,并将这些应用发布到各个社交平台、通讯软件,甚至通过API或SDK集成到你的业务系统中。二、扣子能做什么?扣子提供了可视化设计与编排工具。

2025-03-21 15:05:00 1224

原创 2025打算转行AI大模型算法工程师,前景怎么样?_ai算法工程师怎么样

从ChatGPT到新近的GPT-4,GPT模型的发展表明,AI正在向着“类⼈化”⽅向迅速发展。GPT-4具备深度阅读和识图能⼒,能够出⾊地通过专业考试并完成复杂指令,向⼈类引以为傲的“创造⼒”发起挑战。现有的就业结构即将发⽣重⼤变化,社会⽣产⼒的快速提升将催⽣新的⾏业和岗位机会。如何与⼈⼯智能协同⼯作,利⽤AI辅助办公已经成为各⾏从业者的必修课。脉脉创始⼈兼CEO林凡认为,从“⼈⼯智障”向“⼈⼯智能”的进化节点,**是⼤模型的出现**。

2025-03-21 15:03:45 1039

原创 打造个人AI大模型:本地电脑部署全攻略_本地部署ai大模型

现在的ai很多,让我看得有些眼花缭乱,随着ai的发展,现在已经有很多ai的大模型已经支持开源,所以现在支持部署一个大模型在自己电脑上,数据私人化。如果不知道自己是否需要或者是否合适配置可以跳到本文的结尾查看小编的使用感受

2025-03-17 23:02:48 1160

原创 【2025超详细汇总】大模型面经指南(附答案)

LLM(Large Language Model,大型语言模型)是指基于大规模数据和参数量的语言模型。Transformer架构:大模型LLM常使用Transformer架构,它是一种基于自注意力机制的序列模型。Transformer架构由多个编码器层和解码器层组成,每个层都包含多头自注意力机制和前馈神经网络。这种架构可以捕捉长距离的依赖关系和语言结构,适用于处理大规模语言数据。自注意力机制(Self-Attention):自注意力机制是Transformer架构的核心组件之一。

2025-03-17 22:36:27 1129 1

原创 尝试基于0.5B小模型复现DeepSeek-R1的思维链

本文主要是以两个目的出发:• 第一个是简单地介绍下LLM训练的一个完整流程,侧重点在于帮助认识这个过程,而不是严谨地对每一个剖析细节,因此基本没有公式推导,但一些必要的符号是避免不了的;• 第二个是尝试使用小模型(0.5B)来复现DeepSeek-R1的思维链模式,仅仅是一个demo级别的实践。

2025-03-15 13:34:32 1200

原创 无敌!大模型入门学习看这四本书足够了

大模型时代:学习的迷思与破局当ChatGPT的惊鸿一瞥席卷全球,"大模型"不再是科技圈的专属名词,它开始渗透到日常生活的方方面面,引发了人们对未来学习的焦虑与憧憬。 市面上涌现出大量的学习资源,从入门书籍到专业课程,让人眼花缭乱。本文并非简单罗列学习资料,而是希望拨开迷雾,探讨大模型时代学习的本质,并为读者提供一条更具实践性的学习路径。

2025-03-15 13:30:28 1359

原创 从思考,到行动:由Manus爆火谈AI Agent

2025年3月,一款名为Manus的AI产品在社交媒体上引发热议。它的内测邀请码一码难求,甚至被炒至数万元,同时带动了150多只AI智能体概念股涨停。Manus的走红,不仅因为它在GAIA基准测试中超越了OpenAI的Operator模型,达到当前技术最佳水准(SOTA),更因为它代表了一种全新的AI形态——AI Agent(人工智能智能体)。与我们熟悉的ChatGPT等生成式AI不同,AI Agent实现了从“思考”到“行动”的跨越。

2025-03-14 17:08:35 939

原创 2025首发最全面的人工智能学习路线,适合新手和大学生

人工智能已经成为了现代技术的重要组成部分,所以开发人员学习人工智能是非常必要的。人工智能是未来的趋势:人工智能已经成为了未来技术的趋势,它将会在各个领域发挥重要作用,包括医疗、金融、交通、教育等等。人工智能可以提高开发效率:人工智能可以自动化一些重复性的工作,比如数据分析、图像识别等等,这样可以提高开发效率,减少开发时间和成本。人工智能可以提高产品质量:人工智能可以通过分析数据和模式来预测和避免错误,从而提高产品的质量和可靠性。

2025-03-14 16:59:16 1775

原创 2025两会后,大模型浪潮下的机遇与方向

大模型时代的大幕已然拉开,2025 年两会全力推进大模型应用这一决策,为中国的科技发展与经济转型注入了强大动力,带来了无限机遇。它将推动各行业智能化升级,催生出更多创新的商业模式和应用场景,为企业创造广阔的发展空间,也为个人提供了实现自我价值的新舞台。然而,我们也必须正视大模型发展过程中面临的风险与挑战,数据隐私、安全、伦理等问题需要我们共同努力去解决。

2025-03-11 18:50:28 1068

原创 看完这本书瞬间对学Transformer的兴趣达到1000000000000%-《精通Transformer:从零开始构建最先进的NLP模型》(附PDF)

本书由Savas Yldmnm专业人士编写萨瓦斯 ·伊尔蒂利姆 (Savas Yldmnm) 毕业于伊斯坦布尔技术大学计算机工程系,拥有自然 语言处理 (Natural Language Processing,NLP)专业的博士学位。目前,他是土耳其伊斯坦布尔比尔基大学的副教授,也是加拿大瑞尔森大学的访问研究员。他是一位积极热情的讲师和研究员, 具有20多年教授机器学习、深度学习和自然语言处理等课程的丰富经验。他开发了大量的开源软件和资源,为土耳其自然语言理解社区做出了重大贡献。

2025-03-11 18:46:12 985

原创 万字长文经验分享,我做模型量化的那些年!

量化(Quantization)是一种通过线性映射和舍入操作将连续实数映射到一组离散值的方法,该组离散值由给定低精度位数所表示(例如8bit位数可表示256个离散值),如下图所示。通过低精度的数值计算,在成倍压缩内存占用的同时可以实现更快速的计算。Tensor 量化示意图。

2025-03-10 13:56:53 1110

原创 2025最新AI大模型学习路线:(非常详细)AI大模型入门,收藏这一篇就够了!_ai学习路线

AI大模型学习路线:(非常详细)AI大模型学习路线,收藏这一篇就够了!

2025-03-10 13:49:57 1849

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除