在 2025 世界机器人大会上,智元机器人合伙人兼具身业务部总裁姚卯青发表了重要演讲,题为《通向具身智能大规模突破之路 —— 智元的本体数据算法飞轮》,系统阐述了智元在具身智能领域的探索成果与未来方向。智元机器人自 2023 年 2 月成立以来,积极投身于 AI 与机器人的深度融合,取得了一系列令人瞩目的成果。从发布全系列多款机器人产品,到建成规模化生产产线与机器人训练场数据采集中心,在具身智能相关算法领域实现多项创新,并在多个实际应用场景完成探索验证,智元正一步步筑牢技术落地的根基。
姚卯青指出,机器人企业若要实现软硬件产品在行业的有效落地,构建 “本体 - 数据 - 模型 - 场景” 紧密耦合的全栈布局是核心所在。这四个关键要素形成了相互驱动的飞轮迭代逻辑:优质的本体能够产生高质量的数据,海量且高质量的数据为算法的持续突破提供支撑,经过场景试错后的算法又为本体优化、数据采集方向调整以及算法的进一步迭代提供新的指引。这种闭环循环不断加速,推动着企业在技术与应用上持续进步。智元也将在未来分享更多飞轮迭代的成果,推动行业发展。
对于机器人从业者而言,进入飞轮循环面临的首个挑战便是数据问题。与大语言模型从业者不同,机器人从业者需要直面物理世界的强交互特性。他们不仅要调试硬件,还需将模型部署到工业级系统进行测试,这使得机器人对数据的需求与互联网数据存在本质差异。姚卯青提到,现有互联网数据对于机器人训练远远不够,机器人需要大量动作类、长程规划类数据,然而这类数据在网络上极为稀缺。为改变这一现状,智元积极探索,希望能 “种下第一棵树”,吸引更多同行加入数据建设,共同形成数据海洋,目前这一探索已取得阶段性成果。
为破解数据难题,智元于 2024 年底开源了 AgiBot World 百万真机数据集。该数据集旨在为工业级应用提供高质量数据支撑,其中包含百万条机器人数轨迹,并且每条数据都经过多轮审核,确保场景贴近现实、任务复杂多样。在数据采集方式上,智元实现了两项关键创新。其一为对抗式采集数据,即在常规数据采集过程中主动引入干扰,例如改变语言指令、制造视觉扰动等。实践证明,这种方式能提供数倍于常规数据的信息量,有效加快机器人训练收敛速度,且已在多任务和多构型机器人上验证了效果。其二是自主进化式的数据采集,针对机器人在真实环境中自主执行任务时难以提前枚举的 “长尾失效” 问题,智元引入该方案。当机器人执行任务失效瞬间,系统自动接管并打断进程,回退到失效前状态,再通过人工接管完成数据采集。这一方式能将难场景下的高价值数据补充到训练集,有效拓展数据分布边界,依托数据扩增提升机器人能力上限,其逻辑类似 Dagger 算法框架。
围绕数据消费,智元于今年 3 月推出具身智能基座模型 GO-1。该模型在架构上实现了双重创新,其依托 VLM 基础模型和 MOE 混合专家架构,其中 “隐式动作专家” 融合多源数据形成通用动作表达,“显式动作专家” 则将通用描述精准落实到特定本体控制。这一创新设计让座舱真正具备了 “拟人思考” 的硬件基础,让机器人既能从人类视角学习动作规律,又能掌握物理世界交互逻辑。
GO-1 模型发布后,在生活、零售、工业三大场景的评测中表现亮眼。相较于 3 月时的海内外开源模型,成功率提升了 10%-30%。同时,智元发布的 AgiBot World 数据集,能够很好地验证 Scaling Law,研究揭示了预训练的关键规律:数据量、多样性及质量对模型性能影响显著,且实验证明,单一本体预训练数据的后训练迁移效果优于多本体数据。这表明,机器人预训练的核心在于数据场景的多样性、质量,以及适配的模型设计。
除 GO-1 外,智元团队深耕世界模型方向,秉持 “生成理解一体化” 理念。正如人类在做事前会在脑海中规划推演,机器人也需依托世界模型精准推演,以缩短与实际操作的差距。测试显示,在智元自身本体的多任务测试中,GE-Act 效果优于近期开源的 UniVLA 和 NVIDIA 的 GR00T 模型;针对跨本体迁移能力,以 AgiBot World 数据集训练的 GE-Base 模型,在 Franka 等本体上表现优异,在开源 Benchmark 和真机测试中,成功率显著高于现有开源模型。基于世界模型生成的动作,智元机器人能完成叠衣服、组装纸盒等复杂双臂灵巧操作,也能在工业传送带上精准执行物体抓取和打包任务。值得注意的是,相较于 VLA 等短时序输入输出模型,具备长时序推演能力的 GE-Act 在动态场景抓取定位精度上优势明显。
GE-Sim 以动作序列为输入,如同高精度仿真器,能在杂乱真实环境中渲染画面,且具备时空一致性和语义合理性。对比测试显示,其与真实机器人的推理效果高度一致,量化成功率接近。依托该仿真器,可快速迭代机器人策略,极大缩短模型研发周期,减少实际评测中的复杂流程与损失。为规范世界模型评测,智元推出 GEBench 并已在 GitHub 和 HuggingFace 开源,成为 IROS 世界模型挑战赛的重要准备工具。该 Benchmark 从轨迹遵循度、语义合理性、因果一致性等多维度评估模型,而基于机前数据预训练的 GE-Base 模型,在各维度表现均优于主流视频生成类模型。
此前,在 8 月 17 日 8:20 至 8 月 18 日 8:20,智元机器人在上海浦东新区开展了一场备受瞩目的 “夏日 CityWalk” 24 小时全直播活动。活动当日,实测气温高达 37℃,地表温度更是飙升至 61℃,在如此恶劣的高温环境下,全尺寸人形机器人远征 A2 成功完成了全球首次完全自主的 24 小时行走讲解作业挑战。此次直播在智元机器人官方账号及多个媒体账号同步进行,总计观看量突破 30 万人次。活动中,摄影师由于炎热共计更换 73 人次,而远征 A2 却独自稳定地走完了全场,开创了人形机器人发展历史的新篇章。
这场直播全面且真实地展现了机器人在强光、暗光、反光、外部干扰等复杂户外场景中的稳定表现。活动模拟了真实户外场景,路面涵盖柏油、砖石等多种材质,沿途设置了锥桶、减速带等障碍,还遭遇了日间 35℃以上高温、夜间弱光等复杂条件。作为全球首次全尺寸人形机器人 24 小时户外行走直播,其核心目的在于验证远征 A2 在技术实用化方面的关键能力,包括自主行走稳定性、环境适应性及硬件可靠性。
在直播过程中,远征 A2 全程无需遥控干预,自主完成避障、路径规划、步态调整等一系列复杂动作。通过 “热插拔换电” 技术,远征 A2 实现了快速补能,整个换电过程在 20s 内即可完成,并且无需中断任务,非专业人员也能轻松操作。据智元机器人研发代表曹旭介绍,单台机器人累计行走已超 3000 小时,不关机连续运行时长可达数百小时,“24 小时直播仅是日常测试的缩影,我们通过 8 台机器 60 小时压力测试、120 小时连续行走测试,以及正在推进的 720 小时连续行走测试,持续验证其稳定性”。面对户外强光、逆光、温度波动等干扰,远征 A2 的多模态感知系统与大模型融合技术表现出色。上海交通大学自动化与感知学院副院长魏飞明评价:“全尺寸人形机器人在户外场景的适配性是行业难点,远征 A2 在步态算法、环境建模上的突破,尤其是多传感器融合应对光照变化的技术,标志着国内人形机器人从实验室走向真实场景的关键一步。”
此次 24 小时行走挑战的成功,充分彰显了智元机器人在技术研发方面的雄厚实力。自主移动带导航避障的能力,使机器人向真正的 “无限生产力” 迈出了关键第一步。在极端高温环境下,远征 A2 展现出超越人类的适应能力,为在交通岗亭等酷热环境部署机器人执行任务提供了可能。同时,其卓越的可靠性也经受住了长时间的考验,在面对各种意外干扰(如小孩的触碰干扰、夜间猫咪穿行等)时,均能保持良好的运行状态。此外,任务部署的便捷性也是一大亮点,仅需 5 分钟就能完成新任务的部署,机器人讲解的台词也可在 5 分钟内通过修改知识库完成更新,这对展厅讲解、接待等场景的应用推广具有重要意义。
在商业应用方面,智元机器人同样成果斐然。智元坚持 “由易至难” 的策略,目前已在交互服务场景实现突破,成功中标中国移动订单,将远征 A2 应用于企业大厅、营业厅接待等场景。远征 A2 依托强大的记忆能力(可记住 1000 张人脸、100 万条知识库)和垂域知识增强,能够应对各类专业问题。当前,远征 A2 已在交互服务、文娱商演等场景形成规模应用,未来有望拓展至康养陪伴等更多场景。智元机器人市场专家孟彬健表示,商业服务场景相较于工业场景,更易于测算 ROI(投资回报率)。商业场景可通过情绪价值或眼球经济创造收益,例如品牌宣传带来的流量提升可能比投广告更具性价比;而工业场景则需要聚焦客户核心需求做减法,目前机器人能力已达人类 60%-70%,目标是在年底或明年接近 100%。
近期,智元创新(上海)科技有限公司与富临精工股份有限公司达成数千万元标的的项目合作,近百台远征 A2-W 将落地富临精工工厂。这是国内首个工业领域具身机器人规模化商业签单案例,更是该品类在全球智能制造场景的首次规模化落地,标志着工业具身智能从技术验证阶段正式迈入规模化商用新纪元。在 2025 年 7 月,首套远征 A2-W 已在富临精工生产线上料场景完成工业常态化作业直播,其单班次 1000 箱的周转箱配送能力,成功匹配当月单一产线全量排产需求。此次近百台规模的部署,实现了机器人料箱拆垛及上料场景应用从 “单厂试点验证” 到 “多厂全线覆盖” 的跨越式升级,机器人作业范围从最初的 2 个产线点位,拓展至动力总成、减速器两大核心车间的 15 个上料点,每日承接 500 台以上产能的原材料配送任务,同时承担空箱自动化回收工作,单班次完成近万次搬箱动作,成为连接两车间生产流程的核心运力。智元远征 A2-W 轮式通用机器人,专为柔性智造场景打造,可广泛应用于周转箱拆码垛、搬运、上下料等多种场景。
此次合作通过 “具身机器人 + AMR” 构建了深度协同系统,具身机器人 A2-W 负责多层料架周转箱取放,AMR 负责车间内重载整托物料运输。依托生产系统的智能派单与动态叫料机制,AMR 将物料从拣选室配送至线边上料点,具身机器人 A2-W 可自动识别箱体、自主调整姿态,完成拆垛上料及空箱回收,实现从物料出库、产线上料、空箱回收流转的全流程作业。该系统既发挥了具身机器人对周转箱的泛化作业能力以及复杂场景的自适应能力,也充分利用 AMR 在长距离、高负载运输中的效率优势,解决了传统自动化设备在多车间、多品类场景下的柔性适配痛点,为制造业周转箱拆码垛、搬运、上下料等场景提供了可直接复用的协同方案。与此同时,远征 A2-W 的规模化应用,依托于其三大核心技术突破:多模态感知系统可实时识别人员、设备、物料等动态障碍,保障人机混场作业安全;双臂协同与高精度操作模块,能适配不同尺寸、重量的周转箱;自主纠错算法则确保在突发异常时,机器人可自主恢复作业流程,无需人工干预。
富临精工工程部主任邓扬表示:“远征 A2-W 在产线上的表现超出预期 —— 面对码放不规范的料箱能自主调整抓取姿态,遇到人员穿行会实时避障,单班近万次操作零故障,抗干扰和纠错能力远胜传统自动化设备。更重要的是,它可以帮助人类完成车间内重复性强、易造成腰肌劳损的搬箱工作,让工人能专注于更有价值的操作。随着机器人的不断引进和应用,工业具身智能有望重塑制造业生产模式,推动行业智能化转型进入新阶段。项目合作意味着工业具身智能迎来规模化商用,也是智元机器人与富临精工产业生态合作升级,伴随着机器人应用场景的规模化,富临精工作为机器人关节供应商已经感受到了行业创变的机遇。” 智元机器人通用事业部总裁王闯表示:“此次与富临精工的近百台级别的商业签单不仅验证了具身机器人的技术成熟度,更标志着制造业对其商业价值的认可。我们将本项目作为工业具身机器人规模化应用的标杆案例,将以‘场景击穿 - 数据沉淀 - 技术迭代’的落地路径为汽车制造、3C 电子等更多工业场景提供参考。”
从产业影响来看,智元机器人的一系列成果与进展,为整个机器人行业的发展提供了宝贵的经验与借鉴。其在技术研发、数据创新、产品应用等方面的突破,推动了人形机器人从 “概念热” 逐步走向 “实干期”。随着智元机器人产品的不断完善与市场应用的持续拓展,有望带动上下游产业链的协同发展,吸引更多资本与人才进入该领域,促进机器人技术在更多行业的深度应用,加速各行业的智能化转型升级。
在当前智能制造产业蓬勃发展的大背景下,机器人行业的竞争日益激烈,技术创新、资本运作与产业整合成为决定企业成败的关键因素。对于希望在这一领域有所作为的企业而言,深入了解智能制造产业资本运作与并购相关知识至关重要。智能制造产业资本运作与并购高级研修班(https://www.bjs.org.cn/c/16516.html )为企业提供了一个系统学习的优质平台。该课程汇聚业内资深专家与实战精英,通过深入的理论讲解、丰富的案例分析以及模拟实战等多元化教学方式,助力企业掌握资本运作的策略与技巧,在并购过程中精准把握机遇、有效防范风险,实现企业的快速扩张与可持续发展,在智能制造产业这片充满机遇与挑战的领域中抢占先机。
免责声明:本文内容基于公开资料整理,不构成任何投资建议。版权属于原作者,如有侵权请及时联系我们删除。