- 博客(520)
- 收藏
- 关注
原创 【新模型速递】PAI-Model Gallery云上一键部署MiniMax-M1模型
MiniMax公司推出革命性大语言模型MiniMax-M1,采用混合专家架构和闪电注意力机制,支持百万级token上下文处理,计算效率达DeepSeekR1的4倍。该456B参数模型需8*96G显存,阿里云PAI平台已提供零代码部署方案,包含API调用和Web交互功能。PAI-ModelGallery同步接入多款热门模型,如优化版DeepSeek-R1,实现吞吐提升492%、时延降低86%的显著性能突破。
2025-06-23 14:55:03
452
原创 PAI推理重磅发布模型权重服务,大幅降低冷启动与扩容时长
阿里云PAI推出模型权重服务,大幅提升大语言模型部署效率。针对700GB+规模LLM加载耗时问题,该服务采用分布式缓存、RDMA传输、智能预取等技术,实现冷启动和扩容时间显著降低。实测显示,Qwen3-8B模型冷启动时间从235秒降至24秒(降幅89.8%),扩容时长缩至5.7秒(降幅97.6%)。该方案通过内存共享、智能分片等创新,使带宽利用率提升60%+,集群部署效率提升10倍,有效破解超大规模模型部署瓶颈。
2025-06-20 16:28:19
679
原创 DistilQwen-ThoughtX蒸馏模型在PAI-ModelGallery的训练、评测、压缩及部署实践
DistilQwen-ThoughtX 系列蒸馏模型,结合创新的变长思维链推理技术,根据任务难度自适应调整推理步骤,避免传统思维链方法的“过度思考”,大幅度提升推理场景下的模型能力。 DistilQwen-ThoughtX-32B 推理能力更是超越同尺寸 DeepSeek 官方蒸馏模型。通过 PAI-ModelGallery,可一站式零代码完成 DistilQwen-ThoughtX 系列模型的训练、评测、压缩和部署。
2025-06-13 14:17:45
587
原创 从MaxCompute到Milvus:通过DataWorks进行数据同步,实现海量数据高效相似性检索
阿里云Milvus向量检索服务与MaxCompute结合,通过DataWorks实现结构化数据高效向量化同步。该方案支持电商行为分析、医疗知识库构建等AI应用场景,提供从MaxCompute到Milvus的离线同步全流程操作指南,包括数据源配置、任务设置和结果验证。关键优势在于整合MaxCompute的大数据计算能力和Milvus的高效向量检索,解决企业智能化转型中的数据迁移挑战。
2025-06-11 18:27:09
562
原创 一体系数据平台的进化:基于阿里云 EMR Serverless Spark的持续演进
一体系汽配供应链平台因传统大数据平台瓶颈,与阿里云合作,基于 EMR Serverless Spark 构建云原生数据平台。其结合 DataWorks、StarRocks 打造 Lakehouse 架构,历经五阶段演进。迁移后技术、业务收益显著,为 AI 融合奠定数字化基础。
2025-06-10 17:55:36
1315
原创 ES Serverless 8.17王牌发布:向量检索「火力全开」,智能扩缩「秒级响应」!
阿里云 Elasticsearch Serverless 8.17 版重磅升级,带来三大核心突破: 1. 向量检索性能飞跃,原生KNN查询速度提升数十倍,内存占用降低75%,支持混合查询与智能结果融合; 2. 智能弹性调度实现秒级扩容,流量突增6倍仍能稳定响应,成功率保持95%以上; 3. 成本优化显著,采用预留+弹性CU模式,最高节省82%费用。该服务已开放华东/华北/华南多地公测,提供全托管、免运维的搜索解决方案,助力企业应对AI时代的海量数据检索需求。
2025-06-09 17:30:40
1173
原创 Fusion引擎赋能:流利说如何用阿里云Serverless Spark实现数仓计算加速
流利说基于阿里云EMR Serverless Spark构建高效数据平台,解决了原有半托管集群在弹性资源管理、成本、性能等方面的痛点。新架构采用Serverless模式实现按需计费,结合Fusion引擎使任务耗时减少40%,成本降低30%,失败率下降80%。平台整合Airflow调度、Hive元数据管理和OSS存储,支持离线ETL、数据集成和查询等场景,显著提升了任务执行效率与稳定性。
2025-05-30 16:26:44
962
原创 DistilQwen-ThoughtX:变长思维链推理模型,超越DeepSeek蒸馏模型
阿里云PAI团队提出创新思维链优化方法,通过构建包含200万标注思维链的OmniThought数据集,引入推理冗余度(RV)和认知难度(CD)评分机制,解决了大语言模型在复杂推理任务中存在的"过度思考"问题。研究表明,不同难度任务需要匹配相应长度的思维链:简单任务中长思维链会降低效率,而复杂任务则需要更详尽的推理过程。基于这一发现,团队开发了DistilQwen-ThoughtX系列模型,其性能超越同类产品,并在开源社区发布了数据集和模型权重。
2025-05-30 11:52:17
1052
原创 阿里云人工智能平台PAI开源EasyDistill框架助力大语言模型轻松瘦身
阿里云PAI推出开源工具包EasyDistill,旨在简化大型语言模型的知识蒸馏过程。该框架支持数据合成、基础与进阶蒸馏训练,包括黑盒/白盒训练策略、强化学习和偏好优化等方法。基于EasyDistill开发的DistilQwen系列模型在保持小参数量的同时性能卓越,特别是最新变长思维链推理模型DistilQwen-ThoughtX表现优异。项目还开源了包含100万指令数据和200万思维链的数据集,助力社区开发者提升模型性能。
2025-05-29 15:55:47
957
原创 火热邀测!DataWorks数据集成支持大模型AI处理
阿里云大数据开发治理平台 DataWorks 数据集成智能升级,以“ AI 释放数据价值”为核心,推出数据集成支持大模型 AI 处理功能,支持在数据同步过程中对数据进行高级分析和处理,帮助用户利用 AI 技术提升数据质量、挖掘数据价值。
2025-05-28 17:10:13
1011
原创 Cosmos on PAI系列一:PAI-Model Gallery云上一键部署NVIDIA Cosmos Reason-1
NVIDIA Cosmos 是一个世界基础模型(WFMs, world foundation models)开发平台,用于推动物理 AI 的发展,包含先进的视觉标记器、护栏以及加速视频数据处理工具管线。它专为加速智能驾驶汽车和机器人领域的合成数据生成、AI 模型训练与评估而设计。本篇文章介绍 Cosmos 最新世界基础模型 Cosmos Reason-1 如何在阿里云人工智能平台 PAI 上进行快速部署使用。
2025-05-22 17:44:33
749
原创 企业级AI搜索解决方案:阿里云AI搜索开放平台
随着信息技术的飞速发展,搜索引擎作为信息获取的重要工具,扮演着不可或缺的角色。阿里云 AI 搜索开放平台以其强大的技术支持和灵活的开放性,持续为用户提供高效的搜索解决方案。
2025-05-22 13:11:36
985
原创 构建AI时代的大数据基础设施-MaxCompute多模态数据处理最佳实践
本方案通过 MaxCompute 提供面向多模态数据管理的表类型 Object Table,支持对 OSS 上的多模态图片数据进行元数据自动采集管理。同时,通过分布式 Python 计算框架 MaxFrame 完成对多模态数据处理开发,在 DataWorks 的 Notebook 中一站式完成多模态数据处理工作。
2025-05-20 14:49:00
861
原创 StarRocks+Paimon落地阿里日志采集:万亿级实时数据秒级查询
A+流量分析平台是阿里集团统一的全域流量数据分析平台,当前,流量采集团队每天需要的日志数据达到万亿级,在写入和查询面临着巨大挑战。在引入 StarRocks+Paimon 后,实现万亿级实时日志数据的秒级查询。Paimon负责高效存储实时日志数据,StarRocks作为计算引擎提供高性能查询能力。通过分桶表设计、Data Cache优化及文件大小控制,解决了高吞吐写入和高并发查询挑战,查询延迟稳定在秒级,大幅提升日志分析效率。
2025-05-19 13:40:36
630
原创 云上玩转 Qwen3 系列之三:PAI-LangStudio x Hologres构建ChatBI数据分析Agent应用
本文详细介绍了如何使用 LangStudio 和 Qwen3 构建基于 MCP 协议的 Hologres ChatBI 智能 Agent 应用。该应用通过将 Agent、MCP Server 等技术和阿里最新的推理模型 Qwen3 编排在一个应用流中,为大模型提供了 MCP+OLAP 的智能数据分析能力,使用自然语言即可实现 OLAP 数据分析的查询效果,减少了幻觉。开发者可以基于该模板进行灵活扩展和二次开发,以满足特定场景的需求。
2025-05-15 18:33:21
833
原创 开源大数据平台建设经典案例合集
EMR 作为云原生开源大数据平台,凭借其全栈技术生态、弹性资源和开箱即用的优势,已在多个行业头部企业中落地实践,覆盖云原生数据湖、实时湖仓分析、数据湖治理、机器学习等场景。本文精选多个标杆案例,解读 EMR 如何助力企业释放数据价值。
2025-05-13 17:12:53
1010
原创 阿里云 AI 搜索开放平台新增:服务开发能力
AI 搜索开放平台已提供20+原子化服务能力,可灵活组合搭建AI搜索。本期发布将重点解决用户在代码开发中的不便,通过集成 dsw 能力,新增 notebook 功能,为用户提供更便捷的代码编写、调试及运行环境,进一步提升服务调试体验。
2025-05-08 14:59:33
677
原创 云上玩转Qwen3系列之二:PAI-LangStudio搭建联网搜索和RAG增强问答应用
本文详细介绍了如何使用LangStudio和Qwen3构建基于RAG和联网搜索的AI智能问答应用。该应用通过将RAG、web search等技术和阿里最新的推理模型Qwen3编排在一个应用流中。
2025-05-07 17:49:47
942
原创 【解决方案】DistilQwen2.5-DS3-0324蒸馏小模型在PAI-ModelGallery的训练、评测、压缩及部署实践
DistilQwen2.5-DS3-0324 系列中的模型在多个基准测试中表现突出,其32B模型效果甚至接近参数量接近其10倍的闭源大模型。DistilQwen2.5-DS3-0324 系列的发布,助力“大模型+快思考”的新模式,逐步成为解决推理难题的标准配置。
2025-05-07 14:44:44
783
原创 Hologres x 函数计算 x Qwen3,对接MCP构建企业级数据分析 Agent
Hologres 联合函数计算FC 推出「基于 Qwen3 的企业级数据分析 Agent」方案,解决企业级数据分析 Agent 性能、部署、弹性的挑战。
2025-05-06 17:23:03
1348
原创 AI 搜索开放平台 x Qwen3:智能搜索全栈解决方案新升级
阿里云 AI 搜索开放平台与 Qwen3 模型的深度融合,为企业和开发者提供了从基础能力到复杂场景的全栈解决方案,让智能搜索的落地门槛更低、效率更高、体验更佳。
2025-05-06 09:53:38
848
原创 DataWorks Copilot 集成 Qwen3-235B-A22B混合推理模型,AI 效能再升级!
阿里云一站式智能大数据开发治理平台 DataWorks 正式接入 Qwen3 模型,可支持235B最大尺寸。用户通过 DataWorks Copilot 智能助手即可调用该模型,通过自然语言交互完成多种代码操作,实现数据开发、数据分析的快速实现。
2025-04-30 13:37:00
858
原创 PAI Model Gallery 支持云上一键部署 Qwen3 全尺寸模型
Qwen3 是 Qwen 系列最新一代的大语言模型,提供了一系列密集(Dense)和混合专家(MOE)模型。目前,PAI 已经支持 Qwen3 全系列模型一键部署,用户可以通过 PAI-Model Gallery 快速开箱!
2025-04-29 13:23:20
869
原创 云上玩转DeepSeek系列之六:DeepSeek云端加速版发布,具备超高推理性能
PAI 正式推出了优化版 DeepSeek-R1 模型 DeepSeek-R1-PAI-optimized,将大模型推理效率推向了 Next Level。
2025-04-28 14:05:29
738
原创 演讲实录:中小企业如何快速构建AI应用?
阿里云计算平台大数据AI解决方案总监魏博文分享如何通过阿里云提供的大数据AI一体化平台,解决企业开发难、部署繁、成本高等一系列问题,让中小企业快速搭建AI应用。
2025-04-28 11:37:11
540
原创 千万级数据秒级响应!碧桂园基于 EMR Serverless StarRocks 升级存算分离架构实践
碧桂园服务通过引入 EMR Serverless StarRocks 存算分离架构,解决了海量数据处理中的资源利用率低、并发能力不足等问题,显著降低了硬件和运维成本。
2025-04-27 15:27:40
774
原创 通过阿里云Milvus与通义千问VL大模型,快速实现多模态搜索
本文主要演示了如何使用阿里云向量检索服务 Milvus 版与通义千问 VL 大模型,提取图片特征,并使用多模态 Embedding 模型,快速实现多模态搜索。
2025-04-24 15:30:42
836
原创 立马耀:通过阿里云 Serverless Spark 和 Milvus 构建高效向量检索系统,驱动个性化推荐业务
蝉妈妈旗下蝉选通过迁移到阿里云Serverless Spark及Milvus,解决传统架构性能瓶颈与运维复杂性问题。新方案实现离线任务耗时减少40%、失败率降80%,Milvus向量检索成本降低75%,支持更大规模数据处理,查询响应提速。
2025-04-24 10:50:43
745
原创 阿里云 AI 搜索开放平台:RAG智能化工作流助力 AI 搜索
阿里云 AI 搜索开放平台围绕 RAG 场景化及智能化搜索,依托文档智能解析服务对文档内容统一处理后,搭配 RAG 从大规模的文档集合中检索内容并生成更丰富、更具信息量回答。并且在大模型对话上也做了重大更新,采用 QwQ-32B。
2025-04-23 15:14:28
1121
原创 阿里云 AI 搜索开放平台新功能发布:新增GTE自部署模型
阿里云 AI搜索开放平台正式推出 GTE 多语言通用文本向量模型,旨在满足企业全球化业务中的多语言数据处理需求。该模型来源于 ModelScope 模型库,并开放自部署能力,助力企业构建更高并发、更低延迟的多语言搜索与分析系统。
2025-04-23 14:45:41
562
原创 DistilQwen2.5-DS3-0324发布:知识蒸馏+快思考=更高效解决推理难题
DistilQwen2.5-DS3-0324 系列模型引入快思考策略,显著提升推理速度,使得在资源受限的设备和边缘计算场景中,模型能够高效执行复杂任务。DistilQwen2.5-DS3-0324 系列发布,助力“大模型+快思考”的新模式。
2025-04-23 09:46:58
1075
原创 大模型落地的关键:如何用 RAG 打造更智能的 AI 搜索——阿里云 AI 搜索开放平台
大模型落地的关键:如何用 RAG 打造更智能的 AI 搜索——阿里云 AI 搜索开放平台
2025-04-16 13:35:12
1083
原创 阿里云 AI 搜索开放平台新功能发布:大模型联网能力上线
阿里云 AI 搜索开放平台新增大模型联网能力,通过集成大语言模型(LLM)和联网搜索技术,为用户提供更智能、更全面的搜索体验。提供联网搜索API,支持Normal(向量化过滤)、Fast(极速无过滤)、Full(大模型评判过滤)三种策略。
2025-04-16 09:56:46
780
原创 鹰角:EMR Serverless Spark 在《明日方舟》游戏业务的应用
鹰角网络为应对游戏业务多平台扩张带来的高数据需求和资源潮汐问题,采用阿里云EMR Serverless Spark替代原有架构。
2025-04-15 09:53:20
816
原创 面向MoE和推理模型时代:阿里云大数据AI产品升级发布
2025 AI 势能大会上,阿里云大数据 AI 平台持续创新,贴合 MoE 架构、Reasoning Model 、 Agentic RAG、MCP 等新趋势,带来计算范式变革。多款大数据及 AI 产品重磅升级,助力企业客户高效地构建 AI 模型并落地 AI 应用。
2025-04-14 14:40:38
717
原创 阿里云 AI 搜索开放平台:从算法到业务——AI 搜索驱动企业智能化升级
阿里云AI搜索,凭借先进的大模型能力和强大的 RAG 处理技术,为企业提供全场景、高智能、低门槛的搜索服务解决方案。从而更高效构建适合自身企业的大模型应用,实现业务智能化升级。
2025-04-10 14:05:41
1297
原创 用友畅捷通基于阿里云 MaxCompute 搭建智能数仓的落地实践
畅捷通基于阿里云MaxCompute构建智能数仓,解决数据孤岛、大规模复杂数据处理及云原生需求等痛点。通过离线链路实现数据整合与加工,支持指标计算和数据分析场景,构建灵活、高效且可扩展的数据存储与计算体系。
2025-04-09 09:51:13
1122
原创 【解决方案】DistilQwen2.5-R1蒸馏小模型在PAI-ModelGallery的训练、评测、压缩及部署实践
DistilQwen2.5-R1 系列以少量来自 DeepSeek-R1 的思维链蒸馏数据为基础,通过一系列创新的蒸馏策略,有效强化了小模型的深度思考能力。实验评估结果显示,DistilQwen2.5-R1系列中的多种小规模模型在各项基准测试中表现优异,性能显著超越了其他开源蒸馏模型。
2025-04-08 14:45:08
766
原创 阿里云 AI 搜索开放平台新发布:增加 QwQ 模型
阿里云 AI 搜索开放平台新增 QwQ 模型,为企业和开发者提供更高效、智能的搜索解决方案。QwQ 推理模型基于 Qwen2.5-32B 训练,通过强化学习显著提升推理能力。
2025-04-02 11:35:52
646
原创 百观基于阿里云 EMR 的数据湖实践分享
百观科技为应对海量复杂数据处理的算力与成本挑战,基于阿里云 EMR 构建数据湖。EMR 依托高可用的 OSS 存储、开箱即用的 Hadoop/Spark/Iceberg 等开源技术生态及弹性调度,实现数据接入、清洗、聚合与分析全流程。
2025-04-02 10:41:44
976
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人