python_知世-CSDN博客

原创阿里研究院最新发布：2024大模型训练数据白皮书（附完整PDF下载）

报告进一步阐释了高质量数据的标准和评估方法，揭示了高质量数据在提升模型准确性、稳定性和泛化能力方面的作用。特别地，白皮书提出了合成数据作为解决数据供给不足的创新方案，探讨了合成数据的生成方法、分类及其在提升模型训练效率和安全性方面的潜力。此外，白皮书还涵盖了对大模型训练数据治理的深入思考，包括数据合规性、政府与社会力量的协同合作，以及中美在数据获取和利用方面的现状对比。最后，白皮书提出了促进高质量训练数据供给的建议，鼓励政府和社会力量以更开放和务实的方式合作，共同推动人工智能技术的健康发展和产业创新。

2025-06-20 20:17:47 362

原创 Java程序员转行AI大模型：就业指南与实用技巧

在人工智能（AI）迅速发展的背景下，从传统的编程领域如Java程序员转向大模型开发是一个既充满挑战也充满机遇的过程。对于 Java 程序员来说，这也是一个实现职业转型、提升薪资待遇的绝佳机遇。一、明确大模型概念简单来说，大模型就是具有大量参数和强大计算能力的人工智能模型，可以处理各种复杂的任务，如自然语言处理、图像识别等。想象一下，大模型就像是一个超级聪明的大脑，能够理解和处理各种信息。二、转行步骤第一步：学习基础知识。了解机器学习、深度学习的基本概念和原理，掌握常见的算法和模型架构。

2025-06-20 20:16:49 392

原创 2025普通程序员如何转行大模型？这里整理了一份详细攻略_转行大模型学习路

转行大模型领域需要扎实的理论基础和丰富的实践经验。通过系统学习、参与项目和开源社区，你可以逐步掌握大模型技术，并在职业发展中取得成功。希望这份攻略能为你的转行之路提供帮助，祝你在大模型领域大展宏图！

2025-06-20 20:14:18 1006

原创 Spring AI + bge-large + Milvus 构建私有化语义内容检索方案

无论您是科研人员、工程师，还是对AI大模型感兴趣的爱好者，这套报告合集都将为您提供宝贵的信息和启示。：大数据时代，越来越多的企业和机构需要处理海量数据，利用大模型技术可以更好地处理这些数据，提高数据分析和决策的准确性。：大模型应用开发需要掌握机器学习算法、深度学习框架等技术，这些技术的掌握可以提高程序员的编码能力和分析能力，让程序员更加熟练地编写高质量的代码。想正式转到一些新兴的 AI 行业，不仅需要系统的学习AI大模型。同时也要跟已有的技能结合，辅助编程提效，或上手实操应用，增加自己的职场竞争力。

2025-06-17 19:51:12 1014

原创 Spring AI 本地直接运行 Onnx Embedding 模型，结合 Milvus 实现语义向量的存储和检索

无论您是科研人员、工程师，还是对AI大模型感兴趣的爱好者，这套报告合集都将为您提供宝贵的信息和启示。：大数据时代，越来越多的企业和机构需要处理海量数据，利用大模型技术可以更好地处理这些数据，提高数据分析和决策的准确性。：大模型应用开发需要掌握机器学习算法、深度学习框架等技术，这些技术的掌握可以提高程序员的编码能力和分析能力，让程序员更加熟练地编写高质量的代码。同时也要跟已有的技能结合，辅助编程提效，或上手实操应用，增加自己的职场竞争力。执行结束后，可以看到转换后的模型，由于是语言模型，这里。

2025-06-17 19:48:27 895

原创一位双非7年程序员一个月的AI面试经历，原来现在后端转AI掌握这些题就行

大家都知道当前 AI 赛道很火。很多人都在质疑、观望甚至有点小排斥学习 AI。为啥呢？

2025-06-10 16:44:04 683

原创年薪40W！转岗AI产品经理，我做对了这个决策！

却发现市面上关于AI产品经理的学习资料五花八门，信息驳杂，不知道哪个有效，看了一些视频解说、和文章也没办法有效、快速地帮自己提升。

2025-06-10 16:34:37 869

原创零基础实战：从避坑到精通，手把手带你搭建实在Agent智能体

这篇指南将带你：✅ 快速认识实在 Agent✅ 手把手带你搭建 Agent 智能体✅ 避开 90% 初学者都会踩的陷阱

2025-06-10 16:30:27 990

原创 MCP 实战：从零开始实现自己的 MCP Server

图源：https://blog.dailydoseofds.com/p/visual-guide-to-model-context-protocol。

2025-06-07 17:27:53 1008

原创 Qwen3+Ollama本地部署MCP初体验

小伙伴们端午快乐鸭，Qwen3已经发布一段时间了，热度依然不减；端午期间笔者尝试在本地体验Qwen3的能力，将所有过程分享给大家，大家一起动手试一试，一起玩转Qwen3;

2025-06-07 17:14:56 671

原创 NLP界大佬Thomas Wolf等新书再次来袭——《Transformer自然语言处理》，附466页PDF+代码

本书的目标是让您能够构建自己的语言应用程序。为了达到这个目的，它关注于实际的用例，并且只在必要的时候深入研究理论。这本书的风格是动手操作，我们强烈建议您亲自运行代码示例来进行试验。本书涵盖了NLP中transformers的所有主要应用，每一章(除了少数例外)专门针对一个任务，结合一个实际的用例和数据集。每一章还介绍了一些额外的概念。

2025-06-07 17:08:42 1454

原创从0手动构造一个简单的文本生成模型

在构造LlaMa之前，我们先构造一个简单的seq2seq模型，然后逐步对原本的Seq2seq模型，增加LlaMa中的算子RMS、Rope、SwiGLU，直到完整构造LlaMa。首先是一些功能函数的实现，虽然没什么难的，但是最好还是过一遍，因为脑海里有数据的形状，在模型搭建的时候，知道输入进去的是什么样子的，对于理解深度神经网络有很大帮助。

2025-06-04 14:51:11 584

原创 LLaMA Factory：微调LLaMA3模型实现角色扮演

本教程将基于Meta AI开源的Llama-3 8B模型，介绍如何使用PAI平台及LLaMA Factory训练框架完成模型的中文化与角色扮演微调和评估。

2025-06-04 14:47:01 1083

原创人人都能读懂的大模型综合指南《一本书读懂大模型：技术创新、商业应用与产业变革》！大模型零基础入门到精通

这是一本人人都能读懂的大模型综合指南，既是一本大模型的科普书，又是一本大模型的商业书。由中国电信研究院天翼智库官方出版，从核心技术、基础设施、商业应用、产业体系、安全治理5个维度全面讲解了大模型。语言上通俗易懂，内容上深入浅出，呈现上图文并茂，给读者良好阅读体验的同时，让读者对大模型的理解事半功倍！无论你是AI工程师，还是完全没有IT技术背景的爱好者；无论你是一线的从业人员，还是企业的管理者和决策者，你都能通过本书系统理解和掌握大模型，从而深刻认识大模型的核心价值和应用潜力，把握住大模型带来的变革和商机

2025-06-03 15:52:18 1148

原创 AI老板心中的迈巴赫：DeepSeek+Ollama+Xinference+RAGFlow+Dify部署教程，RAG落地5件套！

DeepSeek-R1火了之后，Ai老板部署需求大大提升，抛开效果不谈，五件套易用性和灵活性相比VLLM大大提升，门槛较低，但是效果不言而喻。以下部署全部以docker方式进行，因为太方便了,但同时坑很多，请做好心理准备

2025-06-03 15:50:39 1007

原创实战教程来了！从零开始打造MCP+Ollama集成

在过去一两个个月里，模型上下文协议（Model Context Protocol，MCP）频繁出现在各种技术微信交流群中。我们已经看到了许多很酷的集成案例，大家似乎相信这个标准会长期存在，因为它为大模型与工具或软件的集成设立了规范。

2025-06-03 15:47:30 762

原创《大模型典型示范应用案例集》各大校企共同出品，2024年大模型在各个领域的应用案例，共100个案例！建议收藏！

《大模型典型示范应用案例集》是由中国领先科技企业、研究机构及高校联合编写的行业报告，旨在总结大模型技术在国内各领域行业的落地实践，推动技术标准化实践和产业配套升级。

2025-06-01 11:30:00 304

原创构建一个2B大模型的手把手全流程介绍，从数据准备到模型训练

介绍一个在github上很火的项目，其主要的想法是从头构建一个大模型，作者在这个项目中详细说明了每个步骤以及代码的处理逻辑，大家可以参考，https://github.com/FareedKhan-dev/train-llm-from-scratch

2025-05-30 20:23:20 640

原创他说大模型面试全靠玄学，结果我看到他桌上这本书都快被翻烂了！

万众期待的《百面大模型》来了！这不只是一本面试刷题书，更是一次知识体系的重建，助你在技术的深水区突围。

2025-05-30 15:01:41 1355

原创使用 LangChain + Higress + Elasticsearch 构建 RAG 应用

在本文中，我们将使用 LangChain、Higress 和 Elasticsearch 来构建一个 RAG 应用。本文所使用的代码可以在 Github 上找到：https://github.com/cr7258/hands-on-lab/tree/main/gateway/higress/rag-langchain-es

2025-05-29 15:46:19 903

原创 DeepSeek+LangChain：家教式全流程RAG实战指南（文末附教学代码）

ℹ️RAG全称是Retrieval-Augmented Generation(检索增强生成)，一句话解释就是：把问题和相应的参考资料一起给大模型，以期望得到效果更好的模型表现。ℹ️LangChain包含用于开发大语言模型应用的各种功能组件，不仅仅是RAG，所以相较于RAGFlow、HayStack等专门为RAG设计的框架来说，功能更为丰富，更“笨重”，学习门槛更高。

2025-05-29 15:28:22 772

原创 AI大模型案例应用分享：中国人工智能系列白皮书 | （附181页PDF免费下载）

《中国人工智能系列白皮书——大模型技术（2025版）》是由中国人工智能学会精心编纂的权威报告，全面深入地探讨了大模型技术的最新进展和未来趋势。

2025-05-29 15:25:13 942

原创 MCP实战高阶：借助LangChain快速打造MCP天气助手

本文介绍如何借助LangChain的新开源项目`langchain-mcp-adapters`，让MCP集成变得更加简单高效。

2025-05-26 16:11:29 1260

原创【图解】「1 行 LangChain 代码」竟让 10 万份合同 3 分钟审完？

掌握了LangChain，就能用极少的代码完成原本需要团队数天才能做完的工作。香！这工具不整起来，纯属浪费生产力啊！

2025-05-26 16:08:54 723

原创 2024年中国AI大模型场景探索及产业应用调研报告（附完整PDF下载）

本报告旨在探讨中国AI大模型行业的最新发展趋势、应用场景、市场需求以及面临的挑战和机遇。报告详细分析了AI大模型在金融、政府、影视游戏和教育等领域的应用现状，并指出了行业发展的七大趋势，包括技术趋势、竞争趋势、应用场景趋势等。同时，报告提出了针对政府和企业的发展建议，以促进AI大模型行业的健康发展。此外，报告还对AI大模型行业的投融资情况、合规要求进行了分析，并对未来的投资机会和风险进行了展望。

2025-05-23 15:53:23 651

原创一文彻底搞懂 MCP：AI 大模型的标准化工具箱

本文，我会全面介绍 MCP，包括它的基本概念、核心技术原理，以及它在实际应用中的各种场景。让你轻松掌握 MCP 的所有要点。

2025-05-23 15:52:12 1019

原创 10 分钟带你用 langchain和 js 做一个带RAG的AI医疗助手（附代码）

10 分钟带你用 langchain和 js 做一个带RAG的AI医疗助手（附代码）

2025-05-21 14:51:39 1120

原创使用微软的 GraphRAG + AutoGen + Ollama + Chainlit 来打造一个完全本地且免费的多代理RAG超级机器人

微软整合了 GraphRAG、AutoGen、Ollama 和 Chainlit 技术，打造出强大的多智能体 RAG（检索增强生成）超级机器人，无需依赖在线 LLM，即可进行复杂、基于情境的响应和本地数据处理。

2025-05-21 14:45:36 742

原创 GitHub标星37.4k！一本让每个人都能理解和运用大模型的书籍！

这本在GitHub斩获37.4k标星的书籍把大模型各个环节的内容讲的太透彻了！让每个人都能理解和运用大模型！

2025-05-20 17:41:29 267

原创基于Docker本地搭建Dify详细教程

本文将介绍本地如何部署docker并且利用docker本地部署最近很火的ai应用开发平台Dify

2025-05-15 21:43:37 1259

原创 Swin Transformer深度解析：从原理到代码，一文搞懂 (附完整代码)

提出了一种新的vision Transformer，称为Swin Transformer，它可以作为计算机视觉的通用骨干。将Transformer从语言应用到视觉的挑战来自于这两个领域之间的差异，例如视觉实体规模的巨大差异以及与文本中的单词相比，图像中像素的高分辨率。为了解决这些差异，我们提出了一个分层的Transformer，它的表示是用移位窗口计算的。分层设计和移位窗口方法也被证明对所有mlp体系结构都是有益的。

2025-05-15 21:32:53 1652

原创【Qwen3 + MCP】快速打造一个免费的Qwen AI图像生成助手

本文带你了解了如何使用Qwen3、Qwen Agent和MCP工具集（通过Pollinations）构建一个能够理解你的请求并利用外部工具（如图像生成）的AI助手。

2025-05-13 11:48:52 612

原创整整40页大模型PPT！这是我见过的讲解大模型最易懂、也最漂亮的PPT（完整版）（大模型介绍篇、大模型使用篇、大模型开发篇、大模型扩展篇、大模型应用篇、大模型展望篇）

这版完整版大模型PPT一共包含六个篇章（大模型介绍篇、大模型使用篇、大模型开发篇、大模型扩展篇、大模型应用篇、大模型展望篇）

2025-05-13 11:45:48 377

原创使用Qwen3 8B打造绝对隐私的本地开发环境（附详细教程）

因为ollama使用命令行，对部分小白不是很友好。所以，本文使用LM studio配合Vs code + Roo Code插件实现完全本地运行的开发环境搭建。

2025-05-09 17:02:33 1352

原创打工人必看！Qwen3+MCPs 一键生成爆款笔记，摸鱼式运营轻松涨粉

魔搭开发者打造的小红书笔记自动发布工具 —— 魔搭自动发布小红书 MCP，能一键完成小红书标题、内容及图片的发布。今日，该工具迎来全新版本，不仅延续图片发布功能，还新增视频发布支持。

2025-05-09 16:59:53 906

原创打工人必看！零代码用Dify+MiniMax搭建企业知识库【喂饭级教程】

minimax-01是MiniMax在的（比DeepSeek R1早4天）。参数量没有DeepSeek R1大（），但是实测各方面能力相差不大（性能同样直追GPT-4o和Claude-3.5-Sonnet）最最让我的亮点有原本DeepSeek的API就已经是白菜价了，但是minimax-01的API价格居然比DeepSeek还低（100万tokens仅需1元）。的超长上下文（目前），是Claude-3.5-Sonnet的20倍，GPT-4o的32倍，DeepSeek的62.5倍！

2025-05-07 15:45:43 741

原创如何动手做AI Agent ？Agent入门必备神器，PDF无偿分享

半个月前，粗心的我细心地发现，有一本关于 Agent 的书籍，作者还是熟悉的咖哥（黄佳老师，当年拜读过他的《零基础学机器学习》）。而在昨天，我终于收到了！立刻花了半个小时品读起来~觉得还是非常不错的，所以忍不住给大家分享推荐一下！

2025-05-05 15:08:42 339

原创制造一只电子喵 (qwen2.5:0.5b 微调 LoRA 使用 llama-factory)

使用 llama-factory 工具可以对 AI 语言模型 (LLM) 进行微调 (LoRA SFT), 只需准备数据集即可.可以看到, AI 具有一定的泛化能力, 也就是训练数据集中没有的问题, 模型也可以给出比较合理的回答.此处使用的丹炉不好, 炼不了上品仙丹, 只能用个小模型意思意思. 但原理和操作步骤都是一样的, 只要换上更好的硬件, 准备更多数据, 就能炼制更好更大的仙丹啦 ~AI 并不复杂神秘, 模型只是大 (烧钱) 而已.大力出奇迹, 力大砖飞.

2025-05-04 09:30:00 919

原创实战来了！QwQ-32B消费级显卡微调全流程

许多朋友敲碗的模型微调教程，今天来啦！我们整理了微调教程。包括数据集处理，模型微调等详细步骤，而且模型消费级别显卡（只需20G显存）也能轻松微调。现在就来一步一步进行模型微调吧！🌟第一步下载模型和数据集：首先通过modelscope的SDK下载QwQ-32B的4bit动态量化版本QwQ-32B-unsloth-bnb-4bit和数据集medical-o1-reasoning-SFT。

2025-05-01 10:15:00 833

原创 RAG与微调--本地部署大语言模型在车企OEM的效率提升用途

RAG：灵活、低成本，适合动态知识需求。微调：专精、高性能，适合稳定垂直领域。最佳实践：根据任务复杂度、数据状态和预算权衡，或结合两者优势。

2025-04-28 16:09:30 1694

空空如也

空空如也