自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(719)
  • 收藏
  • 关注

原创 阿里研究院最新发布:2024大模型训练数据白皮书(附完整PDF下载)

报告进一步阐释了高质量数据的标准和评估方法,揭示了高质量数据在提升模型准确性、稳定性和泛化能力方面的作用。特别地,白皮书提出了合成数据作为解决数据供给不足的创新方案,探讨了合成数据的生成方法、分类及其在提升模型训练效率和安全性方面的潜力。此外,白皮书还涵盖了对大模型训练数据治理的深入思考,包括数据合规性、政府与社会力量的协同合作,以及中美在数据获取和利用方面的现状对比。最后,白皮书提出了促进高质量训练数据供给的建议,鼓励政府和社会力量以更开放和务实的方式合作,共同推动人工智能技术的健康发展和产业创新。

2025-06-20 20:17:47 362

原创 Java程序员转行AI大模型:就业指南与实用技巧

在人工智能(AI)迅速发展的背景下,从传统的编程领域如Java程序员转向大模型开发是一个既充满挑战也充满机遇的过程。对于 Java 程序员来说,这也是一个实现职业转型、提升薪资待遇的绝佳机遇。一、明确大模型概念简单来说,大模型就是具有大量参数和强大计算能力的人工智能模型,可以处理各种复杂的任务,如自然语言处理、图像识别等。想象一下,大模型就像是一个超级聪明的大脑,能够理解和处理各种信息。二、转行步骤第一步:学习基础知识。了解机器学习、深度学习的基本概念和原理,掌握常见的算法和模型架构。

2025-06-20 20:16:49 392

原创 2025普通程序员如何转行大模型?这里整理了一份详细攻略_转行大模型学习路

转行大模型领域需要扎实的理论基础和丰富的实践经验。通过系统学习、参与项目和开源社区,你可以逐步掌握大模型技术,并在职业发展中取得成功。希望这份攻略能为你的转行之路提供帮助,祝你在大模型领域大展宏图!

2025-06-20 20:14:18 1006

原创 Spring AI + bge-large + Milvus 构建私有化语义内容检索方案

无论您是科研人员、工程师,还是对AI大模型感兴趣的爱好者,这套报告合集都将为您提供宝贵的信息和启示。: 大数据时代,越来越多的企业和机构需要处理海量数据,利用大模型技术可以更好地处理这些数据,提高数据分析和决策的准确性。: 大模型应用开发需要掌握机器学习算法、深度学习框架等技术,这些技术的掌握可以提高程序员的编码能力和分析能力,让程序员更加熟练地编写高质量的代码。想正式转到一些新兴的 AI 行业,不仅需要系统的学习AI大模型。同时也要跟已有的技能结合,辅助编程提效,或上手实操应用,增加自己的职场竞争力。

2025-06-17 19:51:12 1014

原创 Spring AI 本地直接运行 Onnx Embedding 模型,结合 Milvus 实现语义向量的存储和检索

无论您是科研人员、工程师,还是对AI大模型感兴趣的爱好者,这套报告合集都将为您提供宝贵的信息和启示。: 大数据时代,越来越多的企业和机构需要处理海量数据,利用大模型技术可以更好地处理这些数据,提高数据分析和决策的准确性。: 大模型应用开发需要掌握机器学习算法、深度学习框架等技术,这些技术的掌握可以提高程序员的编码能力和分析能力,让程序员更加熟练地编写高质量的代码。同时也要跟已有的技能结合,辅助编程提效,或上手实操应用,增加自己的职场竞争力。执行结束后,可以看到转换后的模型,由于是语言模型,这里。

2025-06-17 19:48:27 895

原创 一位双非7年程序员一个月的AI面试经历,原来现在后端转AI掌握这些题就行

大家都知道当前 AI 赛道很火。很多人都在质疑、观望甚至有点小排斥学习 AI。为啥呢?

2025-06-10 16:44:04 683

原创 年薪40W!转岗AI产品经理,我做对了这个决策!

却发现市面上关于AI产品经理的学习资料五花八门,信息驳杂,不知道哪个有效,看了一些视频解说、和文章也没办法有效、快速地帮自己提升。

2025-06-10 16:34:37 869

原创 零基础实战:从避坑到精通,手把手带你搭建实在Agent智能体

这篇指南将带你:✅ 快速认识实在 Agent✅ 手把手带你搭建 Agent 智能体✅ 避开 90% 初学者都会踩的陷阱

2025-06-10 16:30:27 990

原创 MCP 实战:从零开始实现自己的 MCP Server

图源:https://blog.dailydoseofds.com/p/visual-guide-to-model-context-protocol。

2025-06-07 17:27:53 1008

原创 Qwen3+Ollama本地部署MCP初体验

小伙伴们端午快乐鸭,Qwen3已经发布一段时间了,热度依然不减;端午期间笔者尝试在本地体验Qwen3的能力,将所有过程分享给大家,大家一起动手试一试,一起玩转Qwen3;

2025-06-07 17:14:56 671

原创 NLP界大佬Thomas Wolf等新书再次来袭——《Transformer自然语言处理》,附466页PDF+代码

本书的目标是让您能够构建自己的语言应用程序。为了达到这个目的,它关注于实际的用例,并且只在必要的时候深入研究理论。这本书的风格是动手操作,我们强烈建议您亲自运行代码示例来进行试验。本书涵盖了NLP中transformers的所有主要应用,每一章(除了少数例外)专门针对一个任务,结合一个实际的用例和数据集。每一章还介绍了一些额外的概念。

2025-06-07 17:08:42 1454

原创 从0手动构造一个简单的文本生成模型

在构造LlaMa之前,我们先构造一个简单的seq2seq模型,然后逐步对原本的Seq2seq模型,增加LlaMa中的算子RMS、Rope、SwiGLU,直到完整构造LlaMa。首先是一些功能函数的实现,虽然没什么难的,但是最好还是 过一遍,因为脑海里有数据的形状,在模型搭建的时候,知道输入进去的是什么样子的,对于理解深度神经网络有很大帮助。

2025-06-04 14:51:11 584

原创 LLaMA Factory:微调LLaMA3模型实现角色扮演

本教程将基于Meta AI开源的Llama-3 8B模型,介绍如何使用PAI平台及LLaMA Factory训练框架完成模型的中文化与角色扮演微调和评估。

2025-06-04 14:47:01 1083

原创 人人都能读懂的大模型综合指南《一本书读懂大模型:技术创新、商业应用与产业变革》!大模型零基础入门到精通

这是一本人人都能读懂的大模型综合指南,既是一本大模型的科普书,又是一本大模型的商业书。由中国电信研究院天翼智库官方出版,从核心技术、基础设施、商业应用、产业体系、安全治理5个维度全面讲解了大模型。语言上通俗易懂,内容上深入浅出,呈现上图文并茂,给读者良好阅读体验的同时,让读者对大模型的理解事半功倍! 无论你是AI工程师,还是完全没有IT技术背景的爱好者;无论你是一线的从业人员,还是企业的管理者和决策者,你都能通过本书系统理解和掌握大模型,从而深刻认识大模型的核心价值和应用潜力,把握住大模型带来的变革和商机

2025-06-03 15:52:18 1148

原创 AI老板心中的迈巴赫:DeepSeek+Ollama+Xinference+RAGFlow+Dify部署教程,RAG落地5件套!

DeepSeek-R1火了之后,Ai老板部署需求大大提升,抛开效果不谈,五件套易用性和灵活性相比VLLM大大提升,门槛较低,但是效果不言而喻。以下部署全部以docker方式进行,因为太方便了,但同时坑很多,请做好心理准备

2025-06-03 15:50:39 1007

原创 实战教程来了!从零开始打造MCP+Ollama集成

在过去一两个个月里,模型上下文协议(Model Context Protocol,MCP)频繁出现在各种技术微信交流群中。我们已经看到了许多很酷的集成案例,大家似乎相信这个标准会长期存在,因为它为大模型与工具或软件的集成设立了规范。

2025-06-03 15:47:30 762

原创 《大模型典型示范应用案例集》各大校企共同出品,2024年大模型在各个领域的应用案例,共100个案例!建议收藏!

《大模型典型示范应用案例集》是由中国领先科技企业、研究机构及高校联合编写的行业报告,旨在总结大模型技术在国内各领域行业的落地实践,推动技术标准化实践和产业配套升级。

2025-06-01 11:30:00 304

原创 构建一个2B大模型的手把手全流程介绍,从数据准备到模型训练

介绍一个在github上很火的项目,其主要的想法是从头构建一个大模型,作者在这个项目中详细说明了每个步骤以及代码的处理逻辑,大家可以参考,https://github.com/FareedKhan-dev/train-llm-from-scratch

2025-05-30 20:23:20 640

原创 他说大模型面试全靠玄学,结果我看到他桌上这本书都快被翻烂了!

万众期待的《百面大模型》来了!这不只是一本面试刷题书,更是一次知识体系的重建,助你在技术的深水区突围。

2025-05-30 15:01:41 1355

原创 使用 LangChain + Higress + Elasticsearch 构建 RAG 应用

在本文中,我们将使用 LangChain、Higress 和 Elasticsearch 来构建一个 RAG 应用。本文所使用的代码可以在 Github 上找到:https://github.com/cr7258/hands-on-lab/tree/main/gateway/higress/rag-langchain-es

2025-05-29 15:46:19 903

原创 DeepSeek+LangChain:家教式全流程RAG实战指南(文末附教学代码)

ℹ️RAG全称是Retrieval-Augmented Generation(检索增强生成),一句话解释就是:把问题和相应的参考资料一起给大模型,以期望得到效果更好的模型表现。ℹ️LangChain包含用于开发大语言模型应用的各种功能组件,不仅仅是RAG,所以相较于RAGFlow、HayStack等专门为RAG设计的框架来说,功能更为丰富,更“笨重”,学习门槛更高。

2025-05-29 15:28:22 772

原创 AI大模型案例应用分享:中国人工智能系列白皮书 | (附181页PDF免费下载)

《中国人工智能系列白皮书——大模型技术(2025版)》是由中国人工智能学会精心编纂的权威报告,全面深入地探讨了大模型技术的最新进展和未来趋势。

2025-05-29 15:25:13 942

原创 MCP实战高阶:借助LangChain快速打造MCP天气助手

本文介绍如何借助LangChain的新开源项目`langchain-mcp-adapters`,让MCP集成变得更加简单高效。

2025-05-26 16:11:29 1260

原创 【图解】「1 行 LangChain 代码」竟让 10 万份合同 3 分钟审完?

掌握了LangChain,就能用极少的代码完成原本需要团队数天才能做完的工作。香!这工具不整起来,纯属浪费生产力啊!

2025-05-26 16:08:54 723

原创 2024年中国AI大模型场景探索及产业应用调研报告(附完整PDF下载)

本报告旨在探讨中国AI大模型行业的最新发展趋势、应用场景、市场需求以及面临的挑战和机遇。报告详细分析了AI大模型在金融、政府、影视游戏和教育等领域的应用现状,并指出了行业发展的七大趋势,包括技术趋势、竞争趋势、应用场景趋势等。同时,报告提出了针对政府和企业的发展建议,以促进AI大模型行业的健康发展。此外,报告还对AI大模型行业的投融资情况、合规要求进行了分析,并对未来的投资机会和风险进行了展望。

2025-05-23 15:53:23 651

原创 一文彻底搞懂 MCP:AI 大模型的标准化工具箱

本文,我会全面介绍 MCP,包括它的基本概念、核心技术原理,以及它在实际应用中的各种场景。让你轻松掌握 MCP 的所有要点。

2025-05-23 15:52:12 1019

原创 10 分钟带你用 langchain和 js 做一个带RAG的AI医疗助手(附代码)

10 分钟带你用 langchain和 js 做一个带RAG的AI医疗助手(附代码)

2025-05-21 14:51:39 1120

原创 使用微软的 GraphRAG + AutoGen + Ollama + Chainlit 来打造一个完全本地且免费的多代理RAG超级机器人

微软整合了 GraphRAG、AutoGen、Ollama 和 Chainlit 技术,打造出强大的多智能体 RAG(检索增强生成)超级机器人,无需依赖在线 LLM,即可进行复杂、基于情境的响应和本地数据处理。

2025-05-21 14:45:36 742

原创 GitHub标星37.4k!一本让每个人都能理解和运用大模型的书籍!

这本在GitHub斩获37.4k标星的书籍把大模型各个环节的内容讲的太透彻了!让每个人都能理解和运用大模型!

2025-05-20 17:41:29 267

原创 基于Docker本地搭建Dify详细教程

本文将介绍本地如何部署docker并且利用docker本地部署最近很火的ai应用开发平台Dify

2025-05-15 21:43:37 1259

原创 Swin Transformer深度解析:从原理到代码,一文搞懂 (附完整代码)

提出了一种新的vision Transformer,称为Swin Transformer,它可以作为计算机视觉的通用骨干。将Transformer从语言应用到视觉的挑战来自于这两个领域之间的差异,例如视觉实体规模的巨大差异以及与文本中的单词相比,图像中像素的高分辨率。为了解决这些差异,我们提出了一个分层的Transformer,它的表示是用移位窗口计算的。分层设计和移位窗口方法也被证明对所有mlp体系结构都是有益的。

2025-05-15 21:32:53 1652

原创 【Qwen3 + MCP】快速打造一个免费的Qwen AI图像生成助手

本文带你了解了如何使用Qwen3、Qwen Agent和MCP工具集(通过Pollinations)构建一个能够理解你的请求并利用外部工具(如图像生成)的AI助手。

2025-05-13 11:48:52 612

原创 整整40页大模型PPT!这是我见过的讲解大模型最易懂、也最漂亮的PPT(完整版)(大模型介绍篇、大模型使用篇、大模型开发篇、大模型扩展篇、大模型应用篇、大模型展望篇)

这版完整版大模型PPT一共包含六个篇章(大模型介绍篇、大模型使用篇、大模型开发篇、大模型扩展篇、大模型应用篇、大模型展望篇)

2025-05-13 11:45:48 377

原创 使用Qwen3 8B打造绝对隐私的本地开发环境(附详细教程)

因为ollama使用命令行,对部分小白不是很友好。所以,本文使用LM studio配合Vs code + Roo Code插件实现完全本地运行的开发环境搭建。

2025-05-09 17:02:33 1352

原创 打工人必看!Qwen3+MCPs 一键生成爆款笔记,摸鱼式运营轻松涨粉

魔搭开发者打造的小红书笔记自动发布工具 —— 魔搭自动发布小红书 MCP,能一键完成小红书标题、内容及图片的发布。今日,该工具迎来全新版本,不仅延续图片发布功能,还新增视频发布支持。

2025-05-09 16:59:53 906

原创 打工人必看!零代码用Dify+MiniMax搭建企业知识库【喂饭级教程】

minimax-01是MiniMax在的(比DeepSeek R1早4天)。参数量没有DeepSeek R1大(),但是实测各方面能力相差不大(性能同样直追GPT-4o和Claude-3.5-Sonnet)最最让我的亮点有原本DeepSeek的API就已经是白菜价了,但是minimax-01的API价格居然比DeepSeek还低(100万tokens仅需1元)。的超长上下文(目前),是Claude-3.5-Sonnet的20倍,GPT-4o的32倍,DeepSeek的62.5倍!

2025-05-07 15:45:43 741

原创 如何动手做AI Agent ?Agent入门必备神器,PDF无偿分享

半个月前,粗心的我细心地发现,有一本关于 Agent 的书籍,作者还是熟悉的咖哥(黄佳老师,当年拜读过他的《零基础学机器学习》)。而在昨天,我终于收到了!立刻花了半个小时品读起来~觉得还是非常不错的,所以忍不住给大家分享推荐一下!

2025-05-05 15:08:42 339

原创 制造一只电子喵 (qwen2.5:0.5b 微调 LoRA 使用 llama-factory)

使用 llama-factory 工具可以对 AI 语言模型 (LLM) 进行微调 (LoRA SFT), 只需准备数据集即可.可以看到, AI 具有一定的泛化能力, 也就是训练数据集中没有的问题, 模型也可以给出比较合理的回答.此处使用的丹炉不好, 炼不了上品仙丹, 只能用个小模型意思意思. 但原理和操作步骤都是一样的, 只要换上更好的硬件, 准备更多数据, 就能炼制更好更大的仙丹啦 ~AI 并不复杂神秘, 模型只是大 (烧钱) 而已.大力出奇迹, 力大砖飞.

2025-05-04 09:30:00 919

原创 实战来了!QwQ-32B消费级显卡微调全流程

许多朋友敲碗的模型微调教程,今天来啦!我们整理了微调教程。包括数据集处理,模型微调等详细步骤,而且模型消费级别显卡(只需20G显存)也能轻松微调。现在就来一步一步进行模型微调吧!🌟第一步 下载模型和数据集:首先通过modelscope的SDK下载QwQ-32B的4bit动态量化版本QwQ-32B-unsloth-bnb-4bit和数据集medical-o1-reasoning-SFT。

2025-05-01 10:15:00 833

原创 RAG与微调--本地部署大语言模型在车企OEM的效率提升用途

RAG:灵活、低成本,适合动态知识需求。微调:专精、高性能,适合稳定垂直领域。最佳实践:根据任务复杂度、数据状态和预算权衡,或结合两者优势。

2025-04-28 16:09:30 1694

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除