自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(551)
  • 收藏
  • 关注

原创 写给LLM新人的个人经验!希望可以帮到你

写给LLM新手的个人经验!希望能帮助到您!

2024-10-17 10:35:47 1244

原创 AI 正在颠覆编程,程序员的出路在哪里?

AI 的飞速发展,让程序员群体感受到了前所未有的压力。我们的工作,真的会被 AI 取代吗?未来的职业发展方向究竟在哪?今天,我们就来聊聊 AI 时代下,程序员的出路到底在哪里。AI 在编程领域的应用正在飞速普及。从 GitHub Copilot 可以自动生成代码,到 ChatGPT 几秒内解答编程问题,这些工具正在迅速改变开发者的工作方式。想象一下,过去需要花几个小时、几天写出来的代码,现在 AI 可以在几分钟内帮你搞定。是的,这个场景听起来像科幻小说,但它正在成为现实。答案是:不会。至少不会完全被取代。

2024-10-09 10:20:29 1934

原创 终于有人把多模态大模型讲这么详细了

多模态大型语言模型(Multimodal Large Language Models, MLLM)的出现是建立在大型语言模型(Large Language Models, LLM)和大型视觉模型(Large Vision Models, LVM)领域不断突破的基础上的。这里给大家总结了多模态大模型的结构,训练,评估方法以及幻觉问题的解决办法,通俗易懂!!

2024-10-06 11:03:36 2053

原创 最详细的AI产品经理学习路径|精确到天

⏩这里,我整理了一份详细的AI产品经理学习路径,大家只要按照思维导图,进行学习就可以了💎整个学习框架和体系是精心打磨的,无脑跟着学,转行AI产品经理就很简单了✊系统框架👇:1️⃣AI产品全局了解2️⃣Python编程3️⃣机器学习4️⃣深度学习5️⃣AI产品设计6️⃣AI产品项目管理7️⃣简历准备与面试。

2024-09-25 10:24:32 1438

原创 面试面经|大模型算法岗常见面试题100道

大模型LLM(Large Language Models) 通常采用基于Transformer的架构。Transformer模型由多个编码器或解码器层组成,每个层包含多头自注意力机制和前馈神经网络。这些层可以并行处理输入序列中的所有位置,捕获长距离依赖关系。大模型通常具有数十亿甚至数千亿个参数,可以处理大量的文本数据,并在各种NLP任务中表现出色。

2024-09-21 10:27:39 2574

原创 初学者如何快速入门大语言模型(LLM)?

在大模型时代,我们如何有效的去学习大模型?现如今大模型岗位需求越来越大,但是相关岗位人才难求,薪资持续走高,AI运营薪资平均值约18457元,AI工程师薪资平均值约37336元,大模型算法薪资平均值约39607元。掌握大模型技术你还能拥有更多可能性• 成为一名全栈大模型工程师,包括Prompt,LangChain,LoRA等技术开发、运营、产品等方向全栈工程;• 能够拥有模型二次训练和微调能力,带领大家完成智能对话、文生图等热门应用;

2024-09-18 14:32:20 1676

原创 救命!真的不要盲目去自学AI大模型!!!

不要盲目去自学AI大模型!!!不要盲目去自学AI大模型!!!不要盲目去自学AI大模型!!!重要的事情说三遍,大模型内容特别多!东学一个西学一个,真的费时又费力!这里给大家分享大模型学习路线 ,让你不在盲目自学大模型适合零基础想系统学习大模型的你

2024-09-11 11:18:49 1370

原创 手把手教你从零搭建自己的知识库_搭建个人知识库

本文介绍了两种搭建知识库的方案:大模型微调(LLM + Fine-tune)和外挂知识库(LLM + 外挂知识库),重点推荐后者并提供了相关源码。项目包含Word2Vec训练教程和简单知识库应用代码,托管在GitHub上。环境搭建部分指导安装Miniconda和创建Python虚拟环境,为开发者提供从零开始构建知识库的完整指南。文中还包含知乎文章的参考链接,帮助读者深入理解相关知识。

2025-07-03 19:12:11 590

原创 DeepSeek企业落地应用讲义精华全版:比清华版更全面、更落地|附259页文件下载

《DeepSeek企业落地应用讲义精华全版》是一份259页的实用指南,全面介绍大模型在企业中的落地应用。内容涵盖四大核心模块:特征价值篇、交互生成篇、智能增强篇和部署开发篇,详细讲解文本生成、行业报告撰写、PPT制作、视频创作及3D建模等场景应用。特别针对企业需求,深入分析本地知识库搭建、智能体开发等技术方案,对比RAG检索增强与微调技术选择,并提供相关工具框架说明。该资料已免费开放下载,包含完整版大模型学习资源,可通过CSDN官方渠道获取。

2025-07-03 18:50:07 376

原创 大模型本地部署的几种方式,超详细的介绍!_本地部署大模型

本文介绍了三种大模型本地部署方法,帮助用户实现定制化需求。1) 应用部署:适合新手,推荐Ollama和LM Studio工具,提供可视化界面和命令行操作;2) 源码部署:需要编程基础,以DeepSeek为例详细说明环境配置、源码编译和模型运行流程;3) 服务化部署:将模型封装为API服务,满足企业级需求。文章还提供了相关工具下载链接和配置指南,帮助用户快速上手大模型本地部署。

2025-06-26 08:10:13 612

原创 本地也能部署Ai大模型?离线部署三种方案(附安装教程!)_stablelm本地部署

本地离线部署AI大模型主要基于五大优势:数据隐私安全(避免敏感信息外泄)、成本控制(长期投入更经济)、低延迟高性能(实时响应需求)、完全自主控制(硬件软件定制化)以及可靠性保障(避免网络依赖)。这种方式特别适用于医疗金融等敏感领域、需稳定成本的场景以及对实时性要求高的应用,同时满足合规要求和深度定制需求。

2025-06-26 08:00:57 692

原创 2025最新最全【大模型学习路线规划】零基础入门到精通

AI大模型系统学习指南 该学习路线分为七个阶段,循序渐进掌握大模型技术: 理论基础:了解大模型概念及GPT发展史 核心技术:Transformer架构、预训练等关键技术 编程基础:Python及常用工具学习 项目实战:代码生成、智能助手等实战案例 高级开发:API应用、RAG等进阶技术 模型优化:微调技术与私有化部署 前沿探索:多模态模型等最新趋势 课程配套640套行业报告、视频教程及开源项目资源,涵盖从理论到落地的完整知识体系,助力开发者快速掌握AI大模型开发能力,提升职场竞争力。完整资源可通过指定二维码

2025-06-26 07:57:58 781

原创 AI大模型本地部署保姆级教程!三种方法教会你如何部署_ai本地部署是什么意思

本文介绍了大模型本地部署的基础知识和工具使用,主要分为CPU和GPU两种部署方式,以及源码部署和应用部署两种方法。重点讲解了ollama和LM Studio两种应用部署工具的操作步骤:ollama通过命令行下载和运行模型,需8GB以上内存;LM Studio提供可视化界面,支持模型搜索、下载和对话,更适合新手。两种工具均兼容Open API接口,为开发者提供便利。文末附赠AGI-CSDN独家资料包。

2025-06-22 11:01:20 1004

原创 大模型综述:万字长文详解AI大模型的原理、应用与未来趋势

本文探讨了大语言模型(LLM)的发展历程和独特优势。从早期的统计语言模型进化到当前的LLM,模型在语言理解和生成能力上取得了显著突破。大语言模型的五大核心魅力包括:强大的上下文理解生成能力、少样本学习能力、多模态融合能力、推理解决问题能力以及持续学习潜力。这些特性使LLM成为人工智能领域的重要突破,展现出向通用人工智能(AGI)发展的潜力。文末还提供了大模型AGI-CSDN的独家资料包。

2025-06-22 10:55:25 675

原创 【AI大模型】2024大模型典型示范应用案例集|附219页PDF文件下载_2024大模型行业应用十大典范案例集x下载

2024 年是大模型深入赋能千行百业,融入实体经济,助力科技创新的一年。截至今年5 月,我国国产大模型的数量已经超过300 个,预示着大模型在各行业场景的创新应用和深度拓展,对培育新质生产力、高水平赋能新型工业化、推动高质量发展发挥了重要作用。今年,国务院政府工作报告首次提出“人工智能+”行动以来,全国各地进一步加速大模型技术与产业的落地融合。————————————————版权声明:本文为CSDN博主「Cc不爱吃洋葱」的原创文章,遵循CC 4.0 BY-SA版权协议,转载请附上原文出处链接及本声明。

2025-06-22 10:52:23 1276

原创 2025最新超全的知识图谱技术与应用指南—通俗易懂版!!

知识图谱:从理论到落地应用 知识图谱作为AI领域的重要技术,已广泛应用于搜索推荐、金融风控、医疗教育等领域。本文系统介绍了知识图谱的概念、构建流程及实际应用: 概念解析:知识图谱本质是包含多种实体和关系的语义网络,可表示为属性图或RDF三元组。 构建流程: 知识抽取:从结构化/非结构化数据中提取实体、关系,涉及实体识别、关系抽取等技术 知识存储:对比RDF存储与图数据库(如Neo4j)的特点及选型建议 落地实践: 以金融风控为例,详细说明从业务定义、数据处理到图谱设计、应用开发的全流程 强调需先明确业务需求

2025-06-19 19:02:26 578

原创 互联网降薪裁员潮,2025年程序员要转行吗?_大厂裁员潮

从人人艳羡的“金饭碗”变成了“裁员重灾区”,从互联网大厂到小微科技公司,程序员们在瑟瑟发抖,没有人能全身而退。

2025-06-19 18:53:52 2077

原创 Dify智能体实战案例:基于内部知识库的智能客服并接入公司官方网站

本文介绍了如何利用Dify平台快速搭建基于内部知识库的智能客服系统并接入企业官网。通过5个关键步骤:部署Dify服务、配置大模型API、创建知识库、开发智能应用以及嵌入网页代码,实现了零基础搭建智能客服的完整流程。文章重点演示了使用DeepSeek大模型和RAG技术,将问答机器人以悬浮窗口形式集成到官网右下角的解决方案。该方案特别适合资源有限的中小企业,能显著提升客户服务效率,文末还提供了大模型学习资料获取方式。

2025-06-18 23:38:18 919

原创 跟我一起从头开始学 AI - RAG 技术学习指南

GitHub 仓库 (由 Fareed Khan 创建) 收集和实现了各种已知的 RAG (Retrieval Augmented Generation - 检索增强生成) 技术。仓库内容:• 演示多种 RAG 技术: 通过一系列 Jupyter Notebook,仓库展示了从简单到复杂的不同 RAG 实现方法。• 提供实用代码示例: 每个 Notebook 都包含可运行的 Python 代码,帮助你理解每种技术的核心概念和实现细节。• 促进 RAG 理解和应用: 帮助开发者和研究人员学习、比较

2025-06-18 23:35:01 761

原创 炸裂!又一个AI大模型的新方向,彻底爆了!!

2025开年,AI技术打得火热,正在改变程序员的职业命运:阿里云核心业务全部接入Agent体系;字节跳动30%后端岗位要求大模型开发能力;腾讯、京东、百度开放招聘技术岗,80%与AI相关……大模型正在重构技术开发范式,传统CRUD开发模式正在被AI原生应用取代!最残忍的是,业务面临转型,领导要求用RAG优化知识库检索,你不会;带AI团队,微调大模型要准备多少数据,你不懂;想转型大模型应用开发工程师等相关岗,没项目实操经验……这不是技术焦虑,而是职业生存危机!

2025-06-17 11:10:15 963

原创 手把手教会你玩转本地大模型:Ollama安装+deepseek部署+Dify接入+独立调用全攻略

本期为大家介绍如何通过Ollama部署本地大模型,Dify如何接入Ollama部署的本地大模型,以及脱离Dify如何方便使用大模型。本期具体内容包括1.Ollama下载安装、2.大模型部署(以deepseek为例)、3.Dify接入本地大模型、4.通过chatbox使用本地大模型(额外内容)。如果只想本地部署大模型可以只看1、2,如果想要通过Dify接入本地大模型可以看1、2、3,如果想脱离Dify直接方便的使用本地大模型可以看1、2、4。 1、Ollama下载安装

2025-06-17 10:59:46 706

原创 实战指南:从零构建 MCP 架构下的 Agentic RAG 系统,无第三方MCP Server

本文探讨了如何利用MCP架构从零构建一个Agentic RAG系统,实现MCP与RAG、Agent的高效融合。主要内容包括:1)分析MCP与RAG的互补性,MCP提供工具而RAG注入知识;2)设计MCP标准下的系统架构,将RAG管道构建置于服务端(基于LlamaIndex),代理功能置于客户端(基于LangGraph);3)详细实现服务端的核心功能,包括文档索引创建、查询工具及缓存机制;4)客户端Agent的设计思路。通过这种模块化分工,系统能够高效处理多文档的复杂查询任务,兼顾灵活性与性能。实验表明该架构

2025-06-17 10:19:55 534

原创 首本系统性讲解大模型RAG书籍出版

《大模型RAG实战》是国内首本系统介绍RAG技术的书籍,由两位资深AI工程师历时10个月完成。全书共8章,涵盖RAG技术原理、核心组件、优化策略和实战应用。重点解析了文本向量化模型训练范式、检索增强技巧、系统评估方法,以及基于LangChain的实战开发。该书创新性地对比了RAG与微调方案的优劣,探讨了从基础系统到多模态Agent的范式演进,并提供了开源代码库持续更新前沿技术。2023年11月启动编写,2024年9月正式出版,填补了RAG领域系统性技术资料的空白。

2025-06-17 10:15:27 693

原创 【写给小白的LLM】AI大模型中的 token 到底是个什么?

摘要: Token是大模型处理文本的最小单位,相当于AI的“文字积木块”,通过分词算法将文本拆分为单词、标点或子词。中英文Token计算不同:英文1个Token≈0.75单词,中文1个Token≈1-2汉字。Token数量直接影响模型成本(如GPT按Token计费)、输入限制(如32K Token上限)和回答质量。主流模型使用子词级编码(如BPE),通过Tokenizer将文本转为数字ID再处理。优化Token使用可节省成本,例如精简提问、控制输出长度。理解Token机制有助于高效使用大模型工具。 (字数:

2025-06-12 22:38:32 710

原创 斯坦福李飞飞最新巨著《AI Agent综述》_aiagent综述 中文版

这篇由李飞飞等14位专家联合撰写的80页论文探讨了多模态AI系统的前沿发展,重点分析了AI代理与环境交互的关键技术。研究涵盖基础模型应用、多模态感知、外部知识整合及人类反馈机制,提出通过改进具身行为预测来增强代理系统性能。论文展望了AI代理在虚拟现实中的创新应用场景,如用户自主创建交互式模拟环境,同时探讨了NLP领域的机器翻译、语音识别等技术进步及其应对假新闻等挑战的解决方案。研究还前瞻性地提出了Agent AI在物理世界行动与虚拟环境交互的未来发展方向。 (全文149字)

2025-06-12 22:34:53 392

原创 Thinker:揭秘AI如何像人类一样“快思考+慢思考”——让大模型推理更聪明、更高效

这篇论文《Thinker》提出了一种创新方法,让大语言模型像人类一样分步骤思考:先快速直觉判断(Fast Thinking),再验证准确性(Verification),必要时深入推理(Slow Thinking),最后提炼精要(Summarization)。实验表明,这种"快思考+慢思考"的闭环训练方式在数学推理任务上表现优异,相比传统方法可减少8倍token消耗,同时提升11.9%的平均准确率。该方法借鉴心理学双系统理论,通过拆解思维过程并针对性训练,使AI既能快速响应,又能精确验证,

2025-06-04 22:02:14 809

原创 上交2025最新-《动手学大模型》实战教程及ppt免费分享!

上海交通大学推出《动手学大模型》免费实战教程,基于AI安全技术课程开发。该教程涵盖大模型微调部署、API调用、文本水印等核心内容,提供详细编程实践指导。包含PPT和完整学习资料,目前已在GitHub获2.2K星标热度。通过简单实践帮助学习者快速入门大模型技术,适合课程设计与学术研究。所有资料可通过指定二维码免费获取,内容包含多模态模型、越狱攻击等前沿领域。

2025-06-04 21:50:57 334

原创 【大模型入门】修改上百次,2025最详细的大模型学习路线整理出来啦!

《2025大模型学习指南:从入门到进阶的全方位路线》为AI新手提供系统化学习路径,涵盖L1-L4四个阶段:L1掌握大模型基础原理与提示工程,L2专攻RAG应用开发,L3进阶Agent架构实践,L4深入模型微调与部署。配套资源包含经典PDF书籍、视频教程、实战项目及面试题库,通过"理论+实践"双轨模式帮助学习者快速成长。完整资料可扫码免费获取,助力从零基础到技术精通的完整进阶。

2025-05-29 21:36:55 306

原创 我们为什么放弃传统RAG?实测案例告诉你,多模态RAG有多强!

摘要 传统文本RAG系统在企业落地中面临准确率不足的问题,主要源于复杂文档(含表格、图片等)在解析、切分、向量化过程中的信息丢失。多模态RAG通过视觉语言模型(VLM)如ColPali/Qwen直接生成图像和文本的融合嵌入向量,显著提升了文档理解能力。实测显示,多模态RAG能准确解析PDF表格、提取目录结构,且检索速度快。尽管需要高性能GPU支持(如4090)且计算成本较高,但其问答质量的提升使这些问题相对次要。多模态RAG已成为解决复杂文档理解的有效方案,KnowFlow将持续在该领域深耕。

2025-05-29 21:31:25 1010

原创 2025最新程序员转行AI大模型教程:非常详细,从入门到精通,收藏这一篇就够了!

本文为Java程序员转行AI大模型开发提供了系统性指南。文章首先明确了大模型作为具备海量参数的智能系统,能够处理NLP、图像识别等复杂任务。针对转型路径,提出了五步走方案:1)学习机器学习/深度学习基础理论;2)掌握TensorFlow/PyTorch等工具框架;3)提升编程与算法优化能力;4)巩固高等数学知识;5)通过开源项目或竞赛积累实战经验。特别指出Java开发者的工程化思维优势,并附赠包含640份行业报告、学习视频等资源的LLM大模型资料包。最后展望了AI大模型时代催生的新型技术岗位,强调模型能力带

2025-05-28 22:38:01 757

原创 蚂蚁开源最新报告:Agent 框架热潮褪去,大模型开发已经进入“生死局”

从 2022 年起,“AI 一天,人间一年”就成了行业内的普遍共识。AI 技术迭代速度之快,让从业者既兴奋又焦虑。一方面,大模型能力正不断进化,疯狂刷新人们的认知边界。从最初的文本生成到多模态交互,从对话式 AI 到具身智能,无一不令人兴奋。另一方面,回看这些年涌现的 AI 项目,一个个迅速地崛起、消亡,其中甚至不乏 AI 独角兽项目跌落神坛,真正能够屹立在山巅的佼佼者寥寥无几。

2025-05-28 22:06:28 849

原创 25年大模型面试必问八股文,背完通过率98%,过来的建议面试真的别想着碰运气!!

这篇文章指出AI大模型领域面试中的常见困境:许多求职者虽然熟练使用各类AI工具,却在技术面试中表现不佳。作者分析了三大问题根源:对前沿技术细节(如MoE调度、RLHF)理解不深、实践与理论脱节、缺乏系统性准备。文中提供了《大模型典型示范应用案例集》等学习资料作为解决方案,强调需要从"会用"进阶到"真懂"才能突破面试瓶颈。最后附有CSDN免费领取完整资料的二维码入口。(149字)

2025-05-27 17:19:52 231

原创 吴恩达&open AI联合推出《大模型通关指南》免费pdf分享,手把手教你掌握大模型技术!

LLM(Large Language Models)正在逐步改变人们的生活,对于开发者来说,如何利用LLM提供的API快速、便捷地开发具备更强大能力、集成LLM的应用程序,以实现更新颖、更实用的功能,是一项急需学习的重要技能。吴恩达老师与OpenAI合作推出的大模型系列教程,从大模型时代开发者的基础技能出发,深入浅出地介绍了如何基于大模型API和LangChain架构快速开发结合大模型强大能力的应用。

2025-05-23 11:55:08 947

原创 2025程序员在AI时代如何保持并提升核心竞争力

随着AIGC(如ChatGPT、Midjourney、Claude等)大语言模型的接连涌现,AI辅助编程工具正逐渐改变程序员的工作方式。一方面,这些工具通过代码生成、调试和优化,大大提高了编程效率,缩短了开发周期;另一方面,随着AI能力的增强,许多人开始担忧部分编程工作将被AI取代。那么,在这场技术变革的浪潮中,程序员应该如何应对,才能保持并提升自身的核心竞争力?

2025-05-23 11:48:17 1420

原创 AI产品经理的Know-How:如何打造公司法务智能助理

在企业运营中,合同管理是法务团队的核心职责之一。随着公司规模扩大和业务复杂化,合同数量激增,手工处理变得效率低下且容易出错。AI技术,尤其是智能助理的引入,可以显著提升法务团队的工作效率并降低风险。作为AI产品经理,设计一款公司法务智能助理需要深入理解法务团队的实际需求,并结合AI技术优化合同管理的各个环节。本文从总体思路、合同草拟、合同审查和履约管理四个方面,探讨如何设计这样一款工具。通过模板化设计、结构化输入和在线协作,提升起草效率;通过多维度审查和LLM技术,增强风险控制;通过日历和互动功能,确保履约

2025-05-23 11:41:53 723

原创 5月大模型面试必问八股文,(非常详细)收藏这一篇就够了,背完通过率98%,大模型面试题+答案!

当前大模型技术发展迅速,相关岗位需求激增,面试竞争激烈。本文汇总了大模型算法岗常见面试题,涵盖基础和进阶内容。基础篇包括主流开源模型体系、prefix LM与causal LM的区别、涌现能力原因、大模型架构介绍、Tokenizer实现方法等。进阶篇涉及LLMs复读机问题、多模态大模型应用、处理长文本策略等。文章旨在帮助求职者系统掌握大模型相关知识,提升面试竞争力。

2025-05-23 11:40:15 675

原创 什么是AI Agents?什么是Agentic AI?他们有何不同?

目前,AI Agents 和 Agentic AI 是近年来备受瞩目的新兴概念。随着生成式人工智能模型(如 ChatGPT)的兴起,AI Agents 和 Agentic AI 的研究和应用迅速扩展。本文将详细探讨 AI Agents 和 Agentic AI 的定义、特性、架构、应用领域以及它们之间的区别,并提供一个专业的对比分析。

2025-05-23 11:32:06 784

原创 自学大模型的进[特殊字符]2025年最完整学习路线

要成功应聘大模型相关岗位(如算法工程师、NLP工程师、研究员等),需要系统性地掌握知识体系并积累高质量项目经验。以下是分阶段的学习路线和项目建议:

2025-05-16 11:26:00 812

原创 手把手教你用“知识图谱+大模型”完成知识抽取

下面我们将以“IAEA2011 在维也纳总部举行的第五十五届常委会”为例,带大家具体演示如何通过“知识图谱+大模型”技术,将pdf版的会议记录进行知识的高效、精准地抽取。

2025-05-16 11:13:37 843

原创 2025大模型书籍推荐!大模型项目实战:多领域智能应用开发(附PDF)_大模型应用开发核心技术与领域实践pdf

今天没有多的废话,直接给大家推荐这本书----《大模型项目实战:多领域智能应用开发》!这本书面向大语言模型应用的使用者和开发者,从大语言模型的基础知识开始,逐步深入,详细介绍了常见的操作方法和各类型应用的开发过程。

2025-05-10 17:40:00 873

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除