2025 年 6 月 30 日,华为在人工智能领域投下重磅炸弹,宣布开源盘古 70 亿参数的稠密模型与 720 亿参数的混合专家模型(盘古 Pro MoE 72B),同时将基于昇腾的模型推理技术同步开源。这一举措不仅是华为昇腾生态战略的重要里程碑,更在 AI 产业引发强烈震动,为大模型技术的创新与行业应用开辟新路径。
技术突围:小参数撬动大性能的创新实践
华为最新开源的盘古 Pro MoE 72B 大模型,以 720 亿参数量、160 亿激活参数量的配置,通过动态激活专家网络的创新设计,实现性能跨越式突破,在 Super CLUE 2025 年 5 月排行榜中,跻身千亿参数量以内大模型国内并列第一 。这种 “以小打大” 的技术路径,打破传统参数规模决定性能的认知,为大模型轻量化发展提供新思路。
回溯华为近期的技术布局,从 6 月 20 日华为开发者大会 2025 上发布的盘古大模型 5.5,到 5 月 30 日推出的 7180 亿参数的盘古 Ultra MoE,其在 NLP、多模态等多领域持续发力,依托 Cloud Matrix384 超节点构建的昇腾 AI 云服务,单卡推理吞吐量达 2300Tokens/s,展现出强大的算力支撑能力。
全栈闭环:国产 AI 基础设施的自主跨越
华为盘古大模型的独特价值,在于其全流程基于昇腾云的全栈软硬件训练而成。从硬件层面的昇腾 NPU、鲲鹏 CPU,到软件架构的训练系统,华为实现了从底层算力到模型研发的 “全栈国产化” 与 “全流程自主可控” 。这种闭环模式不仅验证了国产 AI 基础设施的创新实力,更为国内大模型发展提供了可复制的技术范式。
与行业其他厂商不同,华为秉持 “不作诗,只做事” 的务实战略,同步上线盘古医学、金融、政务等五大盘古行业思考大模型,已在 30 多个行业、500 多个场景落地,切实推动千行万业智能化升级。
生态赋能:开源驱动下的产业协同进化
华为此次开源行动,具有双重战略意义。对昇腾生态而言,开源降低开发者使用国产算力平台的门槛,吸引更多技术力量参与模型开发,加速生态繁荣;对行业发展来说,盘古大模型的开源为垂直领域智能化解决方案提供底层支撑,推动 AI 技术与政务、金融、制造等行业深度融合。
在 AI 技术重塑产业格局的当下,企业如何把握技术趋势实现战略升级?【智能制造产业资本运作与并购高级研修班】由中国社会科学院联合打造,为期 2 年,专为智能制造企业高管设计,聚焦 AI 技术融合与资本运作实战。点击了解课程详情,探寻企业在技术浪潮中的发展新机遇。
免责声明:本文内容基于公开资料整理,不构成任何投资建议。版权属于原作者,如有侵权请及时联系我们删除。