- 博客(117)
- 资源 (1)
- 收藏
- 关注
原创 利用 QVQ 模型构建通用图像目标检测工具
随着人工智能视觉技术的飞速发展,目标检测已成为众多应用的核心,无论是工业自动化、安防监控,还是日常生活的图像分析。大型视觉推理模型,如 QVQ,凭借其强大的理解能力,为实现灵活多变的目标检测任务提供了新的可能。本文将介绍一个简单的 Python 脚本,演示如何利用 QVQ 模型(通过兼容 OpenAI API 的接口,例如阿里云的灵骏智验 - DashScope)来实现对图像中特定目标的自动检测与分类,并将结果结构化输出。
2025-04-28 11:56:01
618
原创 大模型工程师基础之学会使用openai
Structured Outputs 是一种功能,可确保模型生成符合您提供的的响应,避免遗漏必需键或生成无效枚举值。设计模型需遵循的 JSON Schema。注意:并非所有 JSON Schema 功能都受支持,详见支持的 Schema。Structured Outputs 提供了强大的结构化响应能力,适用于多种场景,从数据提取到 UI 生成。相比 JSON 模式,它更可靠且功能更强大。通过合理设计 JSON Schema,您可以充分发挥其潜力,简化开发流程并提升响应一致性。
2025-04-27 09:00:00
701
原创 关于开源大模型(如 LLaMA、InternLM、Baichuan、DeepSeek、Qwen 等)二次开发或训练经验的关键点和概述
中国的大模型接口对“response”功能(如工具调用和结构化输出)的支持相对有限,这可能导致它们在某些复杂任务上的表现不如 OpenAI 的 Responses API。然而,部分模型如 Qwen 已经具备这些能力,显示中国在基础建设上有所投入,但行业标准和接口设计的国际化程度仍有提升空间。
2025-04-25 15:38:58
840
原创 基于长序列生成式语言模型 从裸模型对话 - 人工设置指令模版对话 到文档检索增强对话 到文档 文档摘要 文档图谱 文档图谱社区 增强生成式任务 浏览器交互搜索引擎增强生成式任务 到 规划 执行 评估
进一步的演进涉及文档摘要和知识图谱的整合,显著提升了对话的智能化水平。文档摘要技术如查询聚焦的多文档摘要,允许AI从检索的文档中提取关键信息,生成简洁的总结。这一能力在学术研究和企业报告中尤为重要。知识图谱(Knowledge Graph)则是结构化的知识表示方式,通过连接实体和关系,帮助AI理解文档之间的联系。例如,Neo4j的知识图谱技术被用于构建内部聊天机器人,加速企业信息检索。Ontotext则强调知识图谱在制造业中的应用,中央化企业知识以提升客户满意度。
2025-04-24 14:25:32
899
原创 实战 vLLM:成功部署 DeepSeek 32B (FP8 量化 + Eager Mode)
在大型语言模型(LLM)的部署实践中,效率和资源利用率至关重要。vLLM 是一个广受欢迎的高性能 LLM 推理和服务框架。本文将基于一次成功的启动日志,详细介绍如何使用 vLLM v0.8.1 版本,结合 FP8 权重 量化和 Eager Mode,成功部署模型。
2025-04-21 11:47:25
693
原创 评测 Doubao-1.5-thinking-pro | 豆包·深度思考模型
原生多模态深度推理能力:评估复杂问题拆解、推理深度和幻觉控制(纯文本)以及代码逻辑推理(代码任务)。更强的复杂创作能力:评估原创性、逻辑性和风格适应性(纯文本)以及代码文档生成和功能扩展(代码任务)。更强的数学和专业知识:评估数学推理和跨领域专业回答(纯文本)以及算法分析和专业代码理解(代码任务)。更强的指令遵循和Function Call能力:评估指令理解和任务拆解(纯文本)以及代码任务执行(代码任务)。通过代码片段推理整体项目功能:评估代码功能分析、项目架构推断和优化建议。
2025-04-18 14:46:00
1034
原创 2025 Large Model Employment: Core Technologies Driving the Future
DomainConclusion。
2025-04-16 13:49:59
929
原创 数据预处理与清洗,是有什么工具吗?
数据预处理与清洗是数据科学和算法工程中不可或缺的步骤,确保数据的准确性、一致性和可用性,从而为后续分析或模型训练打下坚实的基础。随着数据规模的不断扩大和数据类型(文本、表格、日志等)的多样化,选择合适的工具和方法变得尤为重要。2025年,数据预处理领域正迎来新的趋势,特别是人工智能(AI)在这一领域的应用,使得数据清洗和预处理更加高效和自动化。
2025-04-15 11:00:07
1048
原创 构建面向大模型训练与部署的一体化架构:从文档解析到智能调度
作者:汪玉珠|算法架构师标签:大模型训练、数据集构建、GRPO、自监督聚类、指令调度系统、Qwen、LLaMA3。
2025-04-14 14:47:36
830
原创 面向数据库场景的大模型交互微调数据集
分析数据库理解目标数据库的模式,包括表结构、关系和常见查询模式。识别用户可能提出的查询类型,例如客户信息检索、库存统计、销售分析等。收集或生成NLQ从真实用户日志中收集NLQ,或使用生成工具(如基于现有数据集的扩展)创建合成查询。确保NLQ覆盖简单到复杂的各种场景,并考虑不同措辞。标注SQL查询为每个NLQ手动或半自动生成对应的SQL查询,确保与数据库模式兼容。可使用现有工具辅助生成,并由专家验证准确性。包含模式信息确保数据集包括或引用数据库模式,例如以JSON格式提供表和列的定义。
2025-04-09 14:58:38
785
原创 面向数据库场景设计大模型交互微调数据集结构
分析数据库理解目标数据库的模式,包括表结构、关系和常见查询模式。识别用户可能提出的查询类型,例如客户信息检索、库存统计、销售分析等。收集或生成NLQ从真实用户日志中收集NLQ,或使用生成工具(如基于现有数据集的扩展)创建合成查询。确保NLQ覆盖简单到复杂的各种场景,并考虑不同措辞。标注SQL查询为每个NLQ手动或半自动生成对应的SQL查询,确保与数据库模式兼容。可使用现有工具辅助生成,并由专家验证准确性。包含模式信息确保数据集包括或引用数据库模式,例如以JSON格式提供表和列的定义。
2025-04-09 14:55:34
849
原创 基于四卡H100 继续预训练 Qwen2.5-7B-Instruct
模型训练方法: LoRA (Low-Rank Adaptation) 微调训练数据: 15,983 个样本训练周期 (Epochs): 9总优化步数: 4,491当前进度: 已完成 1,060/4,491 步 (约 24%),截至 2025-04-08 03:56:06训练时长: 已运行约 13 小时 26 分钟,预计总时长约 56 小时 (基于当前速度 45.62s/it)
2025-04-08 13:29:11
992
1
原创 企业级大模型算法工程师培训
蔚 ❤ 15246115202 速来掌握大模型技术。大模型的稳定性直接影响企业应用的可靠性,需要。,优化业务流程,提高自动化能力。数据是大模型训练的基础,涉及。,可以提升准确性、降低幻觉。企业级大模型培训涉及。(适合企业内网环境)
2025-04-03 14:28:59
598
原创 结合知识图谱和社区检测的文档分割
引言文档分割是将文本划分成有意义且连贯的段落的任务,在众多自然语言处理(NLP)应用中起着至关重要的作用。这些应用包括通过允许在相关文档部分内进行聚焦搜索来提高信息检索系统的效率,通过识别关键主题单元来提高文本摘要的准确性,以及通过隔离文档内的不同主题来改进主题建模。传统的文档分割方法通常依赖于基于规则的方法或词频和分布等统计特征,但在捕捉文本内潜在的主题转变的更深层语义连贯性方面有时会不足。认识到这种局限性,人们越来越有兴趣利用更复杂的技术来实现更具语义信息的文档分割方法。本报告探讨了结合知识图谱和社区检
2025-03-31 14:44:51
391
原创 支持 MCP 协议的开源 AI Agent 项目
MCP 协议由 Anthropic 于 2024 年 11 月开源,旨在标准化大型语言模型(LLM)与外部数据源和工具的交互。它采用客户端-服务器架构,允许 AI 模型通过统一接口访问各种资源,如数据库、API 和本地文件。这种协议的开放性鼓励了开发者社区的创新,尤其是在构建自主 AI Agent 方面。
2025-03-28 16:51:55
1577
原创 【无标题】
总结一下,今天我们沿着Word2Vec、LSTM、Transformers、GPT、BERT、LLaMA到Grok的路线,看到了NLP从词到智能的演进。这些技术推动了智能体的发展,尤其在医疗领域。课程到此结束,有没有最后的问题?总结一下,今天我们追溯了智能体架构从经典反射到现代语言驱动的演进,看到了技术的积累与突破。这些架构支撑了医疗AI的发展。课程到此结束,有没有最后的问题?总结一下,今天我们探索了智能体与人类的交互演进,从命令到协作,在医疗中潜力巨大。未来,交互将更自然、更智能。
2025-03-26 14:46:09
578
原创 医疗大模型课程从ReAct机制到多智能体再到通用智能体
ReAct的全称是“Reasoning + Acting”,也就是推理加行动。它是一种AI代理的工作方式,要求代理在采取行动前先进行系统性思考。比如,假设我们要查询阿司匹林的副作用,ReAct代理不会直接调用搜索工具,而是先推理:“我需要哪些信息?药物副作用可能在医学文献中,我可以用PubMed查找。”然后再行动,调用API搜索。研究显示,这种方法能让AI的决策更透明、更可靠,尤其在医疗场景中。
2025-03-26 14:12:10
949
原创 一层一层的拆解openmanus 从 run_flow出发一步一步理解 代码设计理念
2025年3月21日 代码pull时间目前openmanus的更新迭代可以说是日新月异https://github.com/mannaandpoem/OpenManushttps://github.com/mannaandpoem/OpenManushttps://github.com/mannaandpoem/OpenManus首先是第一层代码 基于run_flow.py 写了一个run_flow_local.py 其实就是把命令行输入改成了代码进行任务输入。代码解读这段代码实现了一个异步运
2025-03-21 18:37:35
1240
原创 信息收集与问答系统流程分析与改进建议
这些改进将使系统从简单的线性问答流程转变为一个具有自适应性、可解释性和高效资源管理能力的综合智能系统。为当前问题类型排序策略。
2025-03-21 17:35:00
558
原创 参与 OpenManus 黑客松:打造基于本地知识图谱与在线推理的半离线平台
我的目标是基于 OpenManus 框架,设计一个“半离线”运行的智能平台。虽然无法本地部署大模型,但我可以通过本地存储知识图谱和缓存机制,减少对网络的依赖,同时利用在线 API 调用国内大模型,实现复杂推理任务。本地化适配:使用国内模型 API 和百度搜索,贴合中国用户习惯。半离线设计:本地构建知识图谱,缓存推理结果,优化运行效率。多层次推理:从知识图谱到因果理解,覆盖多种智能场景。实用应用:聚焦医疗诊断和金融决策,解决实际问题。
2025-03-20 18:50:09
1027
原创 HippoRAG 2 的调研工作
HippoRAG 2 是一个为大型语言模型(LLM)设计的记忆框架,旨在增强它们识别和利用新知识连接的能力,类似于人类长期记忆。它通过改善关联性(多跳检索)和意义构建(整合大型复杂上下文)来提升 RAG 系统的性能,同时保持简单任务的效率。
2025-03-20 15:59:33
891
原创 具身智能 从纳米技术到星际航行
具身智能是一种强调身体与环境交互来实现智能的行为模式,广泛应用于机器人、AI 和认知科学等领域。用户询问从分子结构到宇宙维度的业务如何利用具身智能模式,我会基于当前研究和企业实践进行分析。具身智能(Embodied Intelligence)是指智能系统通过物理形态与环境互动,感知并执行任务。它在机器人学、AI 研究和认知科学有广泛应用,尤其是在需要跨尺度操作的场景中,如从分子级别的药物设计到宇宙尺度的空间探索。研究表明,具身智能强调身体与环境的交互在认知中的作用,挑战传统计算主义的观点(
2025-03-20 12:55:10
695
原创 推测未来Agentic形态:Dynamic Cognitive Contextual Agent with Reinforcement Learning (DCCA-RL)
在AI Agent设计模式领域,我们见证了从简单的ReAct到复杂的LATS的演进,这些模式通过反思、工具使用、规划和多代理协作,极大地提升了AI的自主性和智能性。然而,随着任务复杂度和动态性需求的增加,现有模式逐渐显现出局限性——多Agent协作带来的联合误差和单Agent设计的适应性不足。,即“动态认知上下文强化学习智能体”。本文将深入探讨DCCA-RL的设计理念、架构、功能和应用场景,展示其如何通过强化学习(RL)和生成式对抗网络(GAN)的联合优化,突破现有技术的边界。
2025-03-20 11:38:02
1490
原创 AI Agent设计模式 四种高层次模式以及更具体的九种模式
AI Agent设计模式是构建智能自主系统的核心框架,允许AI执行复杂任务如规划、推理和行动。之前的文章介绍了九种模式,但用户反馈内容“不够全面,不够丰富”。为此,我们将提供更深入的分析,包括更高层次的分类、实际应用和最新发展,并补充更多资源。
2025-03-20 11:17:50
1134
原创 Excel知识库与LLM结合的解决方案详细分析
pandas+pandasql结合LLM的解决方案为企业知识库构建提供了一种既实用又高效的方法。通过将Excel文件的结构信息纳入知识库,然后利用LLM生成SQL查询并通过pandas执行,最终将结构化数据查询与非结构化文本查询结果相结合,形成了一个强大的智能问答系统。降低实现门槛:利用现有的pandas和SQL技术栈,降低了开发难度提高查询精度:通过结构化查询提高了数据查询的准确性减轻LLM负担:避免将大量表格数据直接输入LLM,节省令牌消耗增强系统灵活性:易于与现有知识库系统集成提升用户体验。
2025-03-20 10:01:17
1213
原创 Excel知识库与LLM结合的解决方案分析
在数据分析和智能问答系统的构建过程中,如何有效地结合结构化数据(如Excel表格)与非结构化数据(如文本文档)成为一个关键挑战。近期接触到的pandas+pandasql解决方案为此提供了一种优雅的处理方式,下面我将对这一方案进行分析和总结。
2025-03-20 09:50:00
766
原创 OpenManus-RL 通过强化学习(RL)提升大型语言模型(LLM)代理的推理和决策能力
OpenManus-RL 是一个致力于通过强化学习技术优化 LLM 代理能力的开源项目。它的目标是增强代理在推理、工具使用和环境交互方面的表现,特别关注代理任务的复杂性。OpenManus-RL 项目采用多种后训练策略来提升 LLM 代理的表现。
2025-03-18 16:57:45
1184
原创 openai 标准化协议 Structured Outputs 具体示例教程
"date": {"description": "支出日期,格式为 YYYY-MM-DD"},"description": "支出金额,单位为人民币(元)"},"enum": ["餐饮", "交通", "娱乐", "购物", "其他"],"description": "支出类别"},"note": {"description": "可选备注,若无则为 null"},设计要点date使用标准日期格式。amount为数字类型,确保精确。category使用枚举限制可选值。note。
2025-03-17 11:04:54
930
原创 openai 标准协议 Function Calling 全面教程
本教程将展示系统通过 Function Calling 实现的多领域能力,包括信息获取、通信、任务执行、数据分析、设备控制等,并提供具体代码示例。通过 Function Calling,系统可以实现从信息获取到设备控制的广泛能力。以下是系统通过 Function Calling 实现的多种能力,每项均附带具体代码示例。用户输入:“添加‘明天买牛奶’到我的待办事项。用户输入:“为我预订明天在巴黎的酒店。用户输入:“给我上个月的销售报告。用户输入:“写一首关于春天的短诗。用户输入:“打开客厅的灯。
2025-03-17 10:55:46
1044
原创 OpenAI的Responses API与Chat Completions API对比
在OpenAI的生态系统中,开发者可以通过两种主要API与模型进行交互:Responses API和Chat Completions API。本教程将深入探讨这两者之间的区别、适用场景以及如何选择最适合您项目需求的API。定位:最新的核心API,是一个代理型API原语特点:结合了Chat Completions的简洁性与更多代理任务的能力推荐对象:新用户内置工具:网络搜索、文件搜索、计算机使用。
2025-03-17 10:24:11
1103
原创 人生很无奈的故事 梦想的影子
我甚至偷偷打开电脑,写了几行代码,可没过多久就关掉,因为我知道,现实里没有时间也没有精力。后来学了点编程,我开始幻想:有一天,我要开发一款游戏,让玩家在我的世界里冒险。回来时,已经是半夜,看着屏幕上没保存的代码,我苦笑了一下,关了机。我低头看看自己的警棍和对讲机,突然觉得挺讽刺——我曾经也想成为那样的人,可现在,我只能站在这里,守护别人的生活。人生很无奈,就像一场游戏,我选错了关卡,走错了路,再也回不到起点。同事们说我踏实,家人说我靠谱,可没人知道,我心里藏着一个没实现的梦——做一款属于自己的游戏。
2025-03-13 14:22:34
272
原创 训练自己的数据分析模型 需要什么数据?
MCP 是一种协议,通过标准化方式让应用程序为 LLM 提供上下文,将上下文管理与 LLM 交互分离,从而提高效率和安全性。Python SDK 实现了完整的 MCP 规范,方便构建暴露资源、提示和工具的服务器,并处理协议消息和生命周期事件。通过标准化数据和功能暴露,它便于创建强大、安全的服务器,辅以全面的文档和社区参与。:一个更复杂的示例,集成数据库操作,将模式信息作为资源暴露,并通过工具允许 SQL 查询执行,展示实际应用。:一个简单服务器,展示资源、工具和提示,如通过资源和工具回显消息。
2025-03-13 14:13:17
741
原创 调查笔记:MCP Python SDK 详细分析
MCP Python SDK 是一个帮助大型语言模型(LLM)管理上下文的工具。它让开发者可以轻松地为 LLM 应用程序提供数据和功能,研究表明这通过标准化方式简化了开发过程。
2025-03-13 14:11:23
1475
原创 如何验证OpenManus智能体的能力?基于Python的测试用例设计
最近在研究一个叫OpenManus的智能体(全名),这是一个基于异步编程(asyncio)的模块,号称能处理任务规划、动态反馈和工具调用等功能。听起来很强大,但实际能力如何?今天我们就来设计一套测试用例,验证它的真实水平,顺便分享一下Python实现的代码,供大家参考。本文将基于一段测试代码,扩展出多个测试用例,覆盖任务解析、规划、工具调用等场景。如果你也在开发类似智能体,或者对异步编程感兴趣,不妨一起看看!通过这套测试用例,我们可以全面验证OpenManus的能力,从任务规划到工具调用,再到多语言支持。
2025-03-12 18:18:25
925
原创 验证通用智能:从理论到实践
定义:AGI指能够在任意任务中表现出类似人类的智能,而非局限于特定领域(如图像识别或语言生成)。特性:学习能力、推理能力、问题解决能力、跨领域适应性、自我改进。与大模型的关系:当前大模型(如Grok、GPT)是窄AI的代表,AGI是其潜在进化目标。多维度测试:语言、推理、创造力等。结合实际任务:如token管理,贴近应用。量化与定性结合:指标+人类评估。动态挑战:不断引入新任务。
2025-03-12 18:00:29
818
原创 超越限制:大模型token管理与优化实践
在大型语言模型(LLM)的应用中,token数量的管理是一个核心挑战。无论是模型的输入限制、计算资源的分配,还是成本的控制,token计数都至关重要。然而,当调用超过预期范围时,我们该如何应对?本书以一段简单的Python代码为起点,探索token管理的实用方法,帮助开发者从临时方案走向系统化解决方案。
2025-03-12 17:21:52
1363
原创 大模型助力自我提升:零基础实用指南
大模型”、“大语言模型”、“LLM”……这些术语可能让你感到困惑。不用担心,让我们用最简单的方式理解它:大模型就像一个超级聪明的朋友,它读过几乎整个互联网的内容,记住了大量的知识,并且能够用自然的方式与你交流。它能解释复杂的概念,回答各种问题,甚至可以为你写文章、代码或者创作故事。
2025-03-12 14:50:43
1125
原创 MCP(模型上下文协议)学习笔记
MCP(模型上下文协议)是AI领域的一个新兴标准,旨在让大型语言模型(LLMs)能够实时连接外部数据源和工具,而不仅仅依赖预训练知识。MCP是一个开放协议,定义了AI模型如何与外部资源(如数据库、API、文件系统和区块链)交互。它让AI能够动态获取最新信息、调用工具,甚至与其他系统协作完成任务。MCP是由Anthropic于2024年11月提出的开放标准,旨在解决AI模型与外部数据源和工具集成的问题。传统上,AI模型受限于预训练数据,难以实时访问外部信息,导致响应可能过时或不准确。
2025-03-12 14:28:27
2043
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人