- 博客(719)
- 收藏
- 关注
原创 阿里研究院最新发布:2024大模型训练数据白皮书(附完整PDF下载)
报告进一步阐释了高质量数据的标准和评估方法,揭示了高质量数据在提升模型准确性、稳定性和泛化能力方面的作用。特别地,白皮书提出了合成数据作为解决数据供给不足的创新方案,探讨了合成数据的生成方法、分类及其在提升模型训练效率和安全性方面的潜力。此外,白皮书还涵盖了对大模型训练数据治理的深入思考,包括数据合规性、政府与社会力量的协同合作,以及中美在数据获取和利用方面的现状对比。最后,白皮书提出了促进高质量训练数据供给的建议,鼓励政府和社会力量以更开放和务实的方式合作,共同推动人工智能技术的健康发展和产业创新。
2025-06-20 20:17:47
362
原创 Java程序员转行AI大模型:就业指南与实用技巧
在人工智能(AI)迅速发展的背景下,从传统的编程领域如Java程序员转向大模型开发是一个既充满挑战也充满机遇的过程。对于 Java 程序员来说,这也是一个实现职业转型、提升薪资待遇的绝佳机遇。一、明确大模型概念简单来说,大模型就是具有大量参数和强大计算能力的人工智能模型,可以处理各种复杂的任务,如自然语言处理、图像识别等。想象一下,大模型就像是一个超级聪明的大脑,能够理解和处理各种信息。二、转行步骤第一步:学习基础知识。了解机器学习、深度学习的基本概念和原理,掌握常见的算法和模型架构。
2025-06-20 20:16:49
392
原创 2025普通程序员如何转行大模型?这里整理了一份详细攻略_转行大模型学习路
转行大模型领域需要扎实的理论基础和丰富的实践经验。通过系统学习、参与项目和开源社区,你可以逐步掌握大模型技术,并在职业发展中取得成功。希望这份攻略能为你的转行之路提供帮助,祝你在大模型领域大展宏图!
2025-06-20 20:14:18
1006
原创 Spring AI + bge-large + Milvus 构建私有化语义内容检索方案
无论您是科研人员、工程师,还是对AI大模型感兴趣的爱好者,这套报告合集都将为您提供宝贵的信息和启示。: 大数据时代,越来越多的企业和机构需要处理海量数据,利用大模型技术可以更好地处理这些数据,提高数据分析和决策的准确性。: 大模型应用开发需要掌握机器学习算法、深度学习框架等技术,这些技术的掌握可以提高程序员的编码能力和分析能力,让程序员更加熟练地编写高质量的代码。想正式转到一些新兴的 AI 行业,不仅需要系统的学习AI大模型。同时也要跟已有的技能结合,辅助编程提效,或上手实操应用,增加自己的职场竞争力。
2025-06-17 19:51:12
1014
原创 Spring AI 本地直接运行 Onnx Embedding 模型,结合 Milvus 实现语义向量的存储和检索
无论您是科研人员、工程师,还是对AI大模型感兴趣的爱好者,这套报告合集都将为您提供宝贵的信息和启示。: 大数据时代,越来越多的企业和机构需要处理海量数据,利用大模型技术可以更好地处理这些数据,提高数据分析和决策的准确性。: 大模型应用开发需要掌握机器学习算法、深度学习框架等技术,这些技术的掌握可以提高程序员的编码能力和分析能力,让程序员更加熟练地编写高质量的代码。同时也要跟已有的技能结合,辅助编程提效,或上手实操应用,增加自己的职场竞争力。执行结束后,可以看到转换后的模型,由于是语言模型,这里。
2025-06-17 19:48:27
895
原创 一位双非7年程序员一个月的AI面试经历,原来现在后端转AI掌握这些题就行
大家都知道当前 AI 赛道很火。很多人都在质疑、观望甚至有点小排斥学习 AI。为啥呢?
2025-06-10 16:44:04
683
原创 年薪40W!转岗AI产品经理,我做对了这个决策!
却发现市面上关于AI产品经理的学习资料五花八门,信息驳杂,不知道哪个有效,看了一些视频解说、和文章也没办法有效、快速地帮自己提升。
2025-06-10 16:34:37
869
原创 零基础实战:从避坑到精通,手把手带你搭建实在Agent智能体
这篇指南将带你:✅ 快速认识实在 Agent✅ 手把手带你搭建 Agent 智能体✅ 避开 90% 初学者都会踩的陷阱
2025-06-10 16:30:27
990
原创 MCP 实战:从零开始实现自己的 MCP Server
图源:https://blog.dailydoseofds.com/p/visual-guide-to-model-context-protocol。
2025-06-07 17:27:53
1008
原创 Qwen3+Ollama本地部署MCP初体验
小伙伴们端午快乐鸭,Qwen3已经发布一段时间了,热度依然不减;端午期间笔者尝试在本地体验Qwen3的能力,将所有过程分享给大家,大家一起动手试一试,一起玩转Qwen3;
2025-06-07 17:14:56
671
原创 NLP界大佬Thomas Wolf等新书再次来袭——《Transformer自然语言处理》,附466页PDF+代码
本书的目标是让您能够构建自己的语言应用程序。为了达到这个目的,它关注于实际的用例,并且只在必要的时候深入研究理论。这本书的风格是动手操作,我们强烈建议您亲自运行代码示例来进行试验。本书涵盖了NLP中transformers的所有主要应用,每一章(除了少数例外)专门针对一个任务,结合一个实际的用例和数据集。每一章还介绍了一些额外的概念。
2025-06-07 17:08:42
1454
原创 从0手动构造一个简单的文本生成模型
在构造LlaMa之前,我们先构造一个简单的seq2seq模型,然后逐步对原本的Seq2seq模型,增加LlaMa中的算子RMS、Rope、SwiGLU,直到完整构造LlaMa。首先是一些功能函数的实现,虽然没什么难的,但是最好还是 过一遍,因为脑海里有数据的形状,在模型搭建的时候,知道输入进去的是什么样子的,对于理解深度神经网络有很大帮助。
2025-06-04 14:51:11
584
原创 LLaMA Factory:微调LLaMA3模型实现角色扮演
本教程将基于Meta AI开源的Llama-3 8B模型,介绍如何使用PAI平台及LLaMA Factory训练框架完成模型的中文化与角色扮演微调和评估。
2025-06-04 14:47:01
1083
原创 人人都能读懂的大模型综合指南《一本书读懂大模型:技术创新、商业应用与产业变革》!大模型零基础入门到精通
这是一本人人都能读懂的大模型综合指南,既是一本大模型的科普书,又是一本大模型的商业书。由中国电信研究院天翼智库官方出版,从核心技术、基础设施、商业应用、产业体系、安全治理5个维度全面讲解了大模型。语言上通俗易懂,内容上深入浅出,呈现上图文并茂,给读者良好阅读体验的同时,让读者对大模型的理解事半功倍! 无论你是AI工程师,还是完全没有IT技术背景的爱好者;无论你是一线的从业人员,还是企业的管理者和决策者,你都能通过本书系统理解和掌握大模型,从而深刻认识大模型的核心价值和应用潜力,把握住大模型带来的变革和商机
2025-06-03 15:52:18
1148
原创 AI老板心中的迈巴赫:DeepSeek+Ollama+Xinference+RAGFlow+Dify部署教程,RAG落地5件套!
DeepSeek-R1火了之后,Ai老板部署需求大大提升,抛开效果不谈,五件套易用性和灵活性相比VLLM大大提升,门槛较低,但是效果不言而喻。以下部署全部以docker方式进行,因为太方便了,但同时坑很多,请做好心理准备
2025-06-03 15:50:39
1007
原创 实战教程来了!从零开始打造MCP+Ollama集成
在过去一两个个月里,模型上下文协议(Model Context Protocol,MCP)频繁出现在各种技术微信交流群中。我们已经看到了许多很酷的集成案例,大家似乎相信这个标准会长期存在,因为它为大模型与工具或软件的集成设立了规范。
2025-06-03 15:47:30
762
原创 《大模型典型示范应用案例集》各大校企共同出品,2024年大模型在各个领域的应用案例,共100个案例!建议收藏!
《大模型典型示范应用案例集》是由中国领先科技企业、研究机构及高校联合编写的行业报告,旨在总结大模型技术在国内各领域行业的落地实践,推动技术标准化实践和产业配套升级。
2025-06-01 11:30:00
304
原创 构建一个2B大模型的手把手全流程介绍,从数据准备到模型训练
介绍一个在github上很火的项目,其主要的想法是从头构建一个大模型,作者在这个项目中详细说明了每个步骤以及代码的处理逻辑,大家可以参考,https://github.com/FareedKhan-dev/train-llm-from-scratch
2025-05-30 20:23:20
640
原创 他说大模型面试全靠玄学,结果我看到他桌上这本书都快被翻烂了!
万众期待的《百面大模型》来了!这不只是一本面试刷题书,更是一次知识体系的重建,助你在技术的深水区突围。
2025-05-30 15:01:41
1355
原创 使用 LangChain + Higress + Elasticsearch 构建 RAG 应用
在本文中,我们将使用 LangChain、Higress 和 Elasticsearch 来构建一个 RAG 应用。本文所使用的代码可以在 Github 上找到:https://github.com/cr7258/hands-on-lab/tree/main/gateway/higress/rag-langchain-es
2025-05-29 15:46:19
903
原创 DeepSeek+LangChain:家教式全流程RAG实战指南(文末附教学代码)
ℹ️RAG全称是Retrieval-Augmented Generation(检索增强生成),一句话解释就是:把问题和相应的参考资料一起给大模型,以期望得到效果更好的模型表现。ℹ️LangChain包含用于开发大语言模型应用的各种功能组件,不仅仅是RAG,所以相较于RAGFlow、HayStack等专门为RAG设计的框架来说,功能更为丰富,更“笨重”,学习门槛更高。
2025-05-29 15:28:22
772
原创 AI大模型案例应用分享:中国人工智能系列白皮书 | (附181页PDF免费下载)
《中国人工智能系列白皮书——大模型技术(2025版)》是由中国人工智能学会精心编纂的权威报告,全面深入地探讨了大模型技术的最新进展和未来趋势。
2025-05-29 15:25:13
942
原创 MCP实战高阶:借助LangChain快速打造MCP天气助手
本文介绍如何借助LangChain的新开源项目`langchain-mcp-adapters`,让MCP集成变得更加简单高效。
2025-05-26 16:11:29
1260
原创 【图解】「1 行 LangChain 代码」竟让 10 万份合同 3 分钟审完?
掌握了LangChain,就能用极少的代码完成原本需要团队数天才能做完的工作。香!这工具不整起来,纯属浪费生产力啊!
2025-05-26 16:08:54
723
原创 2024年中国AI大模型场景探索及产业应用调研报告(附完整PDF下载)
本报告旨在探讨中国AI大模型行业的最新发展趋势、应用场景、市场需求以及面临的挑战和机遇。报告详细分析了AI大模型在金融、政府、影视游戏和教育等领域的应用现状,并指出了行业发展的七大趋势,包括技术趋势、竞争趋势、应用场景趋势等。同时,报告提出了针对政府和企业的发展建议,以促进AI大模型行业的健康发展。此外,报告还对AI大模型行业的投融资情况、合规要求进行了分析,并对未来的投资机会和风险进行了展望。
2025-05-23 15:53:23
651
原创 一文彻底搞懂 MCP:AI 大模型的标准化工具箱
本文,我会全面介绍 MCP,包括它的基本概念、核心技术原理,以及它在实际应用中的各种场景。让你轻松掌握 MCP 的所有要点。
2025-05-23 15:52:12
1019
原创 10 分钟带你用 langchain和 js 做一个带RAG的AI医疗助手(附代码)
10 分钟带你用 langchain和 js 做一个带RAG的AI医疗助手(附代码)
2025-05-21 14:51:39
1120
原创 使用微软的 GraphRAG + AutoGen + Ollama + Chainlit 来打造一个完全本地且免费的多代理RAG超级机器人
微软整合了 GraphRAG、AutoGen、Ollama 和 Chainlit 技术,打造出强大的多智能体 RAG(检索增强生成)超级机器人,无需依赖在线 LLM,即可进行复杂、基于情境的响应和本地数据处理。
2025-05-21 14:45:36
742
原创 GitHub标星37.4k!一本让每个人都能理解和运用大模型的书籍!
这本在GitHub斩获37.4k标星的书籍把大模型各个环节的内容讲的太透彻了!让每个人都能理解和运用大模型!
2025-05-20 17:41:29
267
原创 Swin Transformer深度解析:从原理到代码,一文搞懂 (附完整代码)
提出了一种新的vision Transformer,称为Swin Transformer,它可以作为计算机视觉的通用骨干。将Transformer从语言应用到视觉的挑战来自于这两个领域之间的差异,例如视觉实体规模的巨大差异以及与文本中的单词相比,图像中像素的高分辨率。为了解决这些差异,我们提出了一个分层的Transformer,它的表示是用移位窗口计算的。分层设计和移位窗口方法也被证明对所有mlp体系结构都是有益的。
2025-05-15 21:32:53
1652
原创 【Qwen3 + MCP】快速打造一个免费的Qwen AI图像生成助手
本文带你了解了如何使用Qwen3、Qwen Agent和MCP工具集(通过Pollinations)构建一个能够理解你的请求并利用外部工具(如图像生成)的AI助手。
2025-05-13 11:48:52
612
原创 整整40页大模型PPT!这是我见过的讲解大模型最易懂、也最漂亮的PPT(完整版)(大模型介绍篇、大模型使用篇、大模型开发篇、大模型扩展篇、大模型应用篇、大模型展望篇)
这版完整版大模型PPT一共包含六个篇章(大模型介绍篇、大模型使用篇、大模型开发篇、大模型扩展篇、大模型应用篇、大模型展望篇)
2025-05-13 11:45:48
377
原创 使用Qwen3 8B打造绝对隐私的本地开发环境(附详细教程)
因为ollama使用命令行,对部分小白不是很友好。所以,本文使用LM studio配合Vs code + Roo Code插件实现完全本地运行的开发环境搭建。
2025-05-09 17:02:33
1352
原创 打工人必看!Qwen3+MCPs 一键生成爆款笔记,摸鱼式运营轻松涨粉
魔搭开发者打造的小红书笔记自动发布工具 —— 魔搭自动发布小红书 MCP,能一键完成小红书标题、内容及图片的发布。今日,该工具迎来全新版本,不仅延续图片发布功能,还新增视频发布支持。
2025-05-09 16:59:53
906
原创 打工人必看!零代码用Dify+MiniMax搭建企业知识库【喂饭级教程】
minimax-01是MiniMax在的(比DeepSeek R1早4天)。参数量没有DeepSeek R1大(),但是实测各方面能力相差不大(性能同样直追GPT-4o和Claude-3.5-Sonnet)最最让我的亮点有原本DeepSeek的API就已经是白菜价了,但是minimax-01的API价格居然比DeepSeek还低(100万tokens仅需1元)。的超长上下文(目前),是Claude-3.5-Sonnet的20倍,GPT-4o的32倍,DeepSeek的62.5倍!
2025-05-07 15:45:43
741
原创 如何动手做AI Agent ?Agent入门必备神器,PDF无偿分享
半个月前,粗心的我细心地发现,有一本关于 Agent 的书籍,作者还是熟悉的咖哥(黄佳老师,当年拜读过他的《零基础学机器学习》)。而在昨天,我终于收到了!立刻花了半个小时品读起来~觉得还是非常不错的,所以忍不住给大家分享推荐一下!
2025-05-05 15:08:42
339
原创 制造一只电子喵 (qwen2.5:0.5b 微调 LoRA 使用 llama-factory)
使用 llama-factory 工具可以对 AI 语言模型 (LLM) 进行微调 (LoRA SFT), 只需准备数据集即可.可以看到, AI 具有一定的泛化能力, 也就是训练数据集中没有的问题, 模型也可以给出比较合理的回答.此处使用的丹炉不好, 炼不了上品仙丹, 只能用个小模型意思意思. 但原理和操作步骤都是一样的, 只要换上更好的硬件, 准备更多数据, 就能炼制更好更大的仙丹啦 ~AI 并不复杂神秘, 模型只是大 (烧钱) 而已.大力出奇迹, 力大砖飞.
2025-05-04 09:30:00
919
原创 实战来了!QwQ-32B消费级显卡微调全流程
许多朋友敲碗的模型微调教程,今天来啦!我们整理了微调教程。包括数据集处理,模型微调等详细步骤,而且模型消费级别显卡(只需20G显存)也能轻松微调。现在就来一步一步进行模型微调吧!🌟第一步 下载模型和数据集:首先通过modelscope的SDK下载QwQ-32B的4bit动态量化版本QwQ-32B-unsloth-bnb-4bit和数据集medical-o1-reasoning-SFT。
2025-05-01 10:15:00
833
原创 RAG与微调--本地部署大语言模型在车企OEM的效率提升用途
RAG:灵活、低成本,适合动态知识需求。微调:专精、高性能,适合稳定垂直领域。最佳实践:根据任务复杂度、数据状态和预算权衡,或结合两者优势。
2025-04-28 16:09:30
1694
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人