致敬科创新质力量丨2025科创先锋案例正式发布

2025年,全球科技领域亮点纷呈、高光不断:AI开源生态强势崛起,商业航天实现可重复运载技术闭环,脑机接口突破从实验室到临床的关键瓶颈,生物医药、量子计算、可控核聚变等基础科学领域频现里程碑式进展,持续拓宽人类探索未来的边界。

为致敬全球科创新质力量,集中展现科创领域的最新成果,激励各类创新主体深耕科创赛道、勇攀技术高峰,澎湃新闻于2025年10月启动“2025科创先锋案例”公开征集活动,累计收到上百家科创企业的案例申报材料。

历经三个多月的评审团初审、复审、终审多轮严谨评议,最终评选出21个优质案例,充分彰显全球科创领域的潜力、活力与创造力。

智元CMO邱恒讲述预购太空旅游背后的故事:2023年自费购买,想支持“从0到1”的创业

近日,北京穿越者载人航天科技有限公司(以下简称“穿越者”)发布首批太空游客名单引发大众关注。300万元一张太空旅游船票,把商业航天推到了舆论场中央。有人认为这是民营航天的市场化尝试,也有人质疑这是营销噱头。

根据公开报道,首批游客名单中除了穿越者创始人兼CEO雷诗情外,还出现了中国工程院院士李立浧、明星黄景瑜、探路者创始人王静、启赋资本董事长傅哲宽、智元机器人CMO邱恒,以及众擎机器人PM01人形机器人等,集结了学界、商界、航天界、艺术界及娱乐界。

智元CMO邱恒(左一)在发布会现场 来源:智元机器人

日前,澎湃科技记者(www.thepaper.cn)采访了智元机器人CMO邱恒,他向澎湃科技分享了他加入此行背后的故事。在他看来,两年多前他决定成为游客之一,是因为自己本来就想“上天”,想要支持这项“从0到1”的创业项目。

邱恒于2025年5月加入智元机器人,任CMO兼市场和解决方案销售总经理,此前他曾在华为担任企业BG首席营销官、全球Marketing总裁等职务。

邱恒称,他是2023年自费购买的这张太空船票,当时并不是觉得这个行业以后会火,而是出于个人想去太空旅游的愿望。

2023年邱恒生日当天,他受一位从事商业火箭业务的友人之邀,前往观看商业火箭发射。在发射现场,他遇到了穿越者创始人兼CEO雷诗情。

“这是第一个,也是唯一一个跟我说能够送我上天的人。”邱恒回忆说,当时雷诗情向他展示了蓝色起源(Blue Origin)、SpaceX在2022至2023年期间进行商业载人飞行的视频,“她说中国的票价比美国的更划算一些,我觉得可行。”邱恒说自己听完非常心动,“我一直有这个想法,现在突然有人告诉我(送人上天)不是异想天开,真有可能实现,当时觉得非常惊喜。”

回忆与雷诗情的交流,在邱恒看来,这与自己过去见证过的从零开始的创业项目类似,“很多项目从最初看起来异想天开,它最开始可能就是一颗特别小的种子。”

邱恒表示,自己决定和穿越者签合同,除了自己本身就想上天意外,也考虑到当时商业航天尚无人问津,普通人不太会购买,“我属于有意去突破'从0到1',商业航天的尝试,值得支持。”邱恒说。

签订完合同后,穿越者团队带邱恒参观了航天员训练中心,并介绍了未来类似国家航天员的训练流程。他还见到了来自航天系统背景的飞船设计师等核心成员,这进一步增强了他参与航天旅行的信心。

2023年至2025年1月22日期间,邱恒曾与穿越者公司有过几次交流,做过访谈和问卷调查之类的工作。穿越者团队在进行飞船设计时,也会向他征询意见,“这个过程实际是大家共创的”。譬如在太空人因体验方面,穿越者公司会向他询问舱内灯光氛围、是否播放音乐等细节问题。

放眼国际,维珍银河、蓝色起源从无人到载人仅用3至5年。据穿越者官网,成立于2023年1月11日的穿越者致力于打造中国的“龙飞船”,该公司计划用3到4年的时间首先完成亚轨道可重复使用商业载人飞船研制,2028年实现中国乃至亚洲的太空旅游,开启普通人、商业载荷低成本、常态化上太空的新纪元。首批太空游客将搭乘“穿越者壹号”飞行器抵达距离地面约100公里的卡门线——被认为是大气层与太空的分界线——并在亚轨道轨迹停留数分钟,体验3至6分钟的失重感。

如果三年后不能按原计划实现太空飞行怎么办?面对澎湃科技的提问,邱恒回答,“那就(相当于)创业失败了。伟大的尝试都有风险,既然敢于尝试,就能接受任何结果和可能。”

算法驶向现实、能源触碰星辰:澎湃“2026科技开年演讲”上线,6位科创先锋拆解“硬核”未来

2025年,全球科技领域高光时刻频发:AI开源生态强势崛起,商业航天完成可重复运载技术闭环,脑机接口实现从实验室到临床的关键破壁,生物医药、量子计算、可控核聚变等基础科学领域频现里程碑,拓宽人类对未来的想象边界。

2026年,科技产业化浪潮已然澎湃。每一个趋势都暗藏时代机遇,每一次迭代都呼唤先锋发声,每一次变革都向所有人抛出了一个根本性问题:我们正在走向怎样的科技未来?

作为深耕科技创新领域的公共媒体平台,澎湃新闻将于1月29日在上海举办“2026科技展望开年演讲”,集结六大科技前沿领域的科技企业代表、顶尖创新实践者,分享科技发展的趋势,技术迭代的最新动向,在思想的碰撞中捕捉未来机遇。这不是一场单向的宣讲,而是专属科技先锋者的思想交锋场。

轻舟智航联合创始人、董事长兼CEO于骞:《将无人驾驶带进现实》

当算法驾驭汽车,穿行于真实世界的复杂街道,我们便触及了AI革命的新维度,无人驾驶将驶向何处?轻舟智航联合创始人、董事长兼CEO于骞将带来《将无人驾驶带进现实》演讲,为我们描绘无人驾驶加速驶入现实生活的清晰图景。

于骞是国际顶尖的计算机视觉和机器学习专家,本硕毕业于清华大学计算机系,后于南加州大学取得博士学位,在创办轻舟智航前曾任Waymo机器学习算法研发技术负责人及Google街景组关键项目技术负责人。他在CVPR、ICCV等国际计算机视觉顶会发表多篇高影响力学术论文,并曾获评“中国科技出行产业科学企业家”。

星环聚能创始人兼CEO陈锐:《核聚变能:原理、行业与未来》

在大模型飞速迭代之时,一场更为深刻的能源革命正在实验室中悄然酝酿。被喻为“人造太阳”的终极能源——可控核聚变,承载着彻底解决人类能源问题的希望。星环聚能创始人兼CEO陈锐将解读《快速经济地实现聚变能》,勾勒这项终极技术从实验室走向工业时代的可能性。

陈锐,本科毕业于清华大学核工程与核技术专业,后出国深造,获悉尼大学经济学博士,回国后曾担任中央财经大学金融学院教授。目前兼任清华大学校友总会能源专委会理事、清华企业家协会会员,获评省级科技创业领军人才、省级高层次创新创业人才、2024年度观察者网年度科创人物、2024年度WISE商业新世代先锋人物等多项荣誉。负责完成星环聚能多轮数亿人民币融资,并推动公司初步工程验证装置SUNIST-2性能迅速提升至国内领先、国际前列水平,星环聚能亦荣获福布斯创新力50强、中国潜在独角兽等多项荣誉,积极推动核聚变商业化进程。

中科天算创始人兼CEO刘垚圻:《算力大迁徙:从地面到太空》

当地面数据传输引发延迟等问题时,科技巨头们纷纷将目光投向更广阔的疆域——太空,让超大算力中心上天。中科天算创始人兼CEO刘垚圻将聚焦这场“算力的太空远征”,带来《算力大迁徙:从地面到太空》的前瞻演讲,为算力应用打开想象空间。

刘垚圻博士的研究方向为天基计算、空天算力网,CCF容错计算专委副秘书长。深度参与我国多套卫星互联网系统设计论证、标准设计与试验验证系统建设等,完成极光系列星载计算机研制与部署。相关成果发表论文、专利百余篇,获得“6G星辰青年科学家”称号,入选新百星计划等。

除此之外,我们还邀请到英矽智能创始人兼首席执行官Alex Zhavoronkov、格式塔科技创始人兼CEO彭雷、擎朗智能战略技术官刘斐,他们将分别在AI制药、聚焦脑机接口、具身智能等领域,通过多元视角的碰撞,为公众与产业界绘制一幅更清晰、更具深度的技术演进图谱。

英矽智能创始人兼首席执行官Alex Zhavoronkov:《从0到1: 生成式AI和自动化技术赋能药物研发和抗衰老研究》

Alex Zhavoronkov博士拥有生物医药和计算机技术领域的复合背景。他于2019年被Deep Knowledge Analytics列为全球药物发现和先进医疗领域的100名人工智能领导者之一,并多次入选科睿唯安(Clarivate)年度全球“高被引科学家”。

格式塔创始人、CEO彭雷:《超声波,下一代脑机接口如何重构人类智能和AI》

彭雷本科毕业于中科大,研究生毕业于香港理工大学,并于复旦⼤学类脑智能科学与技术研究院取得博⼠学位。他担任天府锦城实验室特聘研究员,是国家“万⼈计划”领军⼈才,曾有多次成功创业经验,2012年创立客如云,后被阿里巴巴本地生活全资收购,2021年联合创立脑虎科技,不到四年带领脑虎科技成为国内侵入式脑机接口领先公司。

擎朗智能战略技术官刘斐:《具身智能的“能与不能”》

刘斐博士毕业于国防科学技术大学机电工程与自动化学院,机器人控制研究方向。长期从事具身智能、人形机器人产品研发工作,发表十余篇论文和学术专著。目前任CCF智能机器人专委会执委、CCF YOCSEF上海分论坛秘书长、CAAI具身智能专委会首届委员、RoboCup机器人世界杯中型组国际组委会主席、RCAP亚太机器人世界杯执委会委员等。

此次演讲将通过澎湃新闻APP 24小时直播频道、视频号、微博号、抖音号、头条号、快手号同步直播。

“‘物理AI’”需求爆发,‘数据稀缺’是最大发展瓶颈

在城市通用智能机器人赛道上,硬件差异正在逐步缩小,真正决定竞争力的仍然在AI“大脑”能力上,“更准确地说是在开放场景下通用AI能力。” 近日,酷哇科技CTO(首席技术官)廖文龙在接受包括澎湃科技(www.thepaper.cn)在内的媒体采访时表示。廖文龙认为,大脑决定了系统能力的上限。构建AI大脑,需要依赖AI来优化AI模型与算法。

酷哇科技(COOWA)成立于2015年,是一家致力于实现物理世界的通用人工智能(Physical AI)的AI机器人服务提供商,2026年全系产品预估出货量将突破10000台,该数字超过公司过去数年交付量的总和,并已实现年度 EBITDA(息税折旧摊销前利润)回正。

2月5日,该公司正式发布Coowa WAM 2.0(World-Action Model)通用世界模型底座。Coowa WAM 2.0(World-Action Model)是一套针对高频且标准化的移动与作业任务构建的通用世界模型,基于Real-to-Sim-to-Real(从真实到模拟再到真实)闭环的通用世界模型。它不仅是“看”世界,更是在潜空间(Latent Space)中推演世界,实现Drive与Work的深度耦合。

廖文龙认为,物理AI模型将在未来3至5年迎来爆发性需求,未来五年,物理前端应该追求高度智能的无人化,而云端决策在未来一段时间仍保持人机协同。

尽管当前物理AI概念火热,但行业面临的核心问题仍然现实。

廖文龙指出,行业面临开放环境下长尾场景无穷尽,真实数据稀缺的瓶颈。“关键不是穷举所有极端情况,而是在不可穷举的前提下,让机器具备可靠安全的‘零样本决策’能力。”这意味着,物理AI接下来需走通一条具备持续商业造血能力的系统化道路,通过可规模化运转的商业闭环,在真实世界中持续获取海量数据,并以此驱动技术的持续迭代。

智慧城市出行服务

“海量数据中大部分是无效的,需要通过自动化流水线完成数据挖掘、自动标注、增量训练和仿真验证。这套Infra的迭代周期越快,竞争力越强。”廖文龙认为,AI Infra决定了数据的质量与规模问题,进而影响模型能力的上限。下一代具身智能的核心突破仍在于AI Model的持续演进。

产学研携手“头脑风暴”:AI如何破解“经验黑箱”、参与量子纠错

“菌种发酵车间里的‘老师傅’经验,能传给‘AI工程师’吗?”

“量子计算机系统非常‘脆弱’,极易受外界环境噪声的干扰,如何让它在高噪声背景下维持逻辑比特的保真度?”

科学智能作为科技创新的关键变量,正深刻重塑科研范式、赋能产业升级。

2月3日,一场持续145分钟的科学智能“百团百项”工程产研共创沙龙在上海举行。

科学智能“百团百项”工程沙龙现场  本文图均为 上海仪电(集团)有限公司 供图

活动中领域科学家、AI科学家、工程师、基金经理人与产业方围坐在一起,围绕化工物质、光刻胶、生物制造AI应用模型、生物制造AI4S创新驱动、量子计算、固态电池等六个方向的产业真实需求,讨论AI从科研走向产业的“现实卡点”。

破解生物发酵的“经验黑箱”

在生物制药行业,发酵是一个极其复杂且敏感的工艺。微生物在不同的生长阶段状态变化复杂,温度、压力、营养供给等变量相互耦合,稍有偏差就可能影响最终产量。

AI+生物制造(人工智能应用模型)组   

上海锐康生物技术研发有限公司总经理赵华透露,目前的发酵优化仍高度依赖“老师傅经验”。一个发酵罐往往涉及上百个调控变量,操作人员需要24小时值守,定时人工投料,工艺判断缺乏实时可视化与系统预测能力。

“整个过程像一个黑箱,”赵华说,“我们积累了大量生产数据,但还没有形成真正可用的智能控制系统。”

赵华希望能够通过AI预测微生物生长曲线,提前判断在哪一个时间节点可能出现问题,实现提前干预和精准调控。

此外,数据也是一大问题。赵华称,生产端在种基培养、发酵过程等环节积累了大量数据,但尚未被充分利用,能否将这些历史数据和工厂的实时数据整合,实现对发酵过程的智能控制?

上海科学智能研究院主任研究员郭昕指出,目前无论在企业实践还是在学术研究中,对于特定菌种代谢通路的认知仍然是局部的,尤其在与高产、高稳定性相关的关键调控路径上,还存在大量未知空间,这也是AI介入的重要研究方向。

目前科研人员已经有了一些研究成果。上海交通大学集成电路学院人工智能与微结构实验室李金金教授介绍了团队研发的“AI工程师”-工业智能引擎 ManuDrive。

通过车间里的数百个传感器,AI系统像“电子哨兵”一样盯着氧气浓度、pH值等100多个指标。更神奇的是,它还有一副“时间的望远镜”:发酵进行到第20小时,它就能预测出第150小时的结果,并提前写好操作方案。

“这就像给生产过程装上了智能大脑和时间的望远镜,能够实时给出最佳的工艺调控方案,提前看到未来生产过程,实时生成最优的工艺方案,大幅提升产量。”李金金说。

据了解,ManuDrive平台将生物制造、材料加工、建筑设计、能源管理、污水处理、高炉模型等跨域调控规则与物理机理,拆解为127个可复用的智能模块(数量仍在增加),并能依据不同场景与功能实现跨领域复用。

研发团队称,ManuDrive 是人工智能生物发酵工程师,能破解“经验黑箱”,提升生物发酵产量,还能精准预测并调控发酵的过程。李金金表示,相关技术已在前期探索中完成可行性验证,并在上海“百团百项”项目体系下持续推进产业结合。

上海科学智能研究院副院长、上海创智学院数字基础设施部部长程远表示,针对生物制造领域原料转化率低的问题,提出通过优化品种和反应条件,利用AI技术探索合成生物代谢路径,以提升产能。上海多个团队在AI应用方面已有积累,未来将加强技术力量,推动中国在合成生物产业上的领先地位。

产学研一起头脑风暴破解前沿问题

和破解生物发酵的“经验黑箱”一样,这场持续145分钟的讨论,集中在一个现实问题上:AI4S能否真正进入工业流程,成为企业研发体系的一部分。

AI+量子计算小组讨论的核心问题是系统的稳定性。上海创智学院全时导师、上海交通大学教授严骏驰表示量子计算现正处于从“实验室原理演示”向“实用化算力转化”的关键过渡期。然而,量子系统对环境极度敏感,外界微小噪声都会让计算状态迅速失真。随着量子芯片规模扩大,校准和纠错产生的数据呈指数级增长,已经超过人工工程师能够处理的范围。

AI+量子计算小组

沙龙讨论小组认为,如何在高噪声背景下维持逻辑比特的保真度是亟待解决的科学难题。在AI可行性分析上,沙龙提出的方向简单来理解即“让AI参与量子纠错”。即通过神经网络识别物理比特错误、强化学习动态调整控制参数,让系统在高噪声环境下维持可靠运行。研究人员认为,AI与量子计算的交叉(QAI)正在成为量子产业化的关键支撑技术之一。

以量子神经网络为代表的前沿架构在处理高维数据特征提取方面展现了巨大的潜力。目前,相关理论已在量子优越性研究及特定应用场景中涌现出大量研究成果,证明了 AI 辅助量子系统在处理复杂科学计算问题上的技术可行性与广泛应用前景。

在生物制造AI4S创新驱动小组上,上海人工智能实验室AI for Science中心青年研究员薛东雨指出当前AI能力受限于数据缺失和标准不一,小组讨论上提出共同开发数据标准,开源以吸引更多贡献,逐步建立AI友好的数据标准体系,从而更好地解决复杂问题。

AI+生物制造(AI4S创新驱动)

在AI+化工物质小组,上海创智学院全时导师、华东师范大学教授朱通提出利用AI优化超临界二氧化碳在岩石孔隙中的流动路径,通过分子级配方设计提升二氧化碳回收效率,并兼顾清洁采油需求。小组评估认为,该方向在技术路径上具备可行性,具有潜在产业应用价值。

AI+化工物质小组

AI+光刻胶小组聚焦国产替代难题。上海人工智能实验室科学家李玉强指出,光刻胶产业链长、反馈周期慢、工艺稳定性要求极高,标准化数据缺失是制约AI应用的重要因素。讨论提出,通过自动化与标准化流程建设,为AI模型提供可训练的数据体系,是推动产业升级的关键前提。

AI+光刻胶小组

AI+固态电池小组围绕材料密度、机械性能与制造成本展开讨论。上海科学智能研究院曹风雷表示,企业已在实际生产中积累大量工艺数据,AI模型在部分环节已显示出优化潜力。未来计划构建针对固态锂电池的多尺度模型体系,将实验数据、仿真数据与制造数据整合,用于实际工艺决策支持。

AI+固态电池小组

用社区凝聚科研与产业

为加快推动以人工智能引领科研范式变革,推进科学智能(AI for Science)的发展,上海市经济和信息化委员会在2025年启动实施了科学智能“百团百项”专项工程,以高价值项目为抓手,力争在两年内支持不少于100个团队、100个项目,推动AI人才、领域科学家和工程团队跨组织、跨领域协作,培育一批“既懂科学、又懂AI、还有产业思维”的青年科学家,形成一批前沿原创性成果。

澎湃科技(www.thepaper.cn)获悉,这场产研沙龙在上海市经济和信息化委员会指导下,由上海仪电(集团)有限公司主办,上海市先导产业促进中心、上海仪电旗下上海埃迪希科技服务有限公司承办。

据上海仪电智算解决方案负责人王丽忱介绍,上海仪电正在牵头承建科学智能开放社区,以统一门户整合一站式科研工具、高质量开源模型库、智能体开发平台以及万卡级公共算力在内的关键资源与服务,为全球科学家提供开放、协同、高效的科研创新平台,降低AI与科研融合的门槛,加速从基础研究到产业应用的转化周期。

上海仪电智算行业拓展总监高磊介绍,此次沙龙与会者打破行业壁垒,围绕“百团百项”专项工程中“产业出题、科学家答题、人工智能解题”的跨领域协同模式,聚焦产业真实需求,共同定义前沿科学问题,探讨AI解决的路径可行性,凝练出具有战略价值的关键科学问题提案。未来,科学智能开放社区将持续举办系列化、主题化的产研共创活动,并依托其平台能力,为活动中涌现的优质项目提供从概念验证到试点应用的全链条支持。

科技展望开年演讲|格式塔彭雷:超声波脑机接口如何重构智能?

1月29日,在澎湃新闻举办的“2026科技展望开年演讲”上,连续创业者、格式塔科技创始人兼CEO彭雷发表了题为《超声波,下一代脑机接口如何重构人类智能和AI》的演讲。作为一位从互联网和AI领域跨界到生命科学的探索者,彭雷深入剖析了脑机接口领域的现状、瓶颈,阐述了以超声波为核心的下一代技术路径,及其可能为神经科学和人工智能带来的颠覆性变革。

彭雷在演讲开篇提到,神经科学与人工智能是“同一枚硬币的两面”。他引述了杰弗里·辛顿、德米斯·哈萨比斯、伊尔亚·苏茨克维、埃隆·马斯克等多位AI与科技巨擘的最新思考,指出当人工智能的发展触及“堆算力”的天花板时,这些“大佬”不约而同地将目光投向了人类大脑的运作机制——这个在数十亿年进化中形成的、最高效的智能范本。

“从探究人脑学习为何没有反向传播,到思考如何用好奇心、同理心等人类价值来训练未来的超级AI,我们看到,AI的下一步突破,很可能需要从神经科学中汲取底层算法的创新灵感。”彭雷说,这种相互启发、相互促进的关系,正是脑机接口技术发展的背景,也是其最终可能实现“碳基与硅基智能融合”的理论基石。

回顾过去二十年的发展,彭雷肯定了以电信号为基础的侵入式脑机接口取得的显著成就,无论是马斯克Neuralink的无线植入,还是国内外团队在帮助渐冻症、高位截瘫患者实现“数字自主权”方面的突破,都证明了这条路径的价值。

这是否就是脑机接口的终局?彭雷认为:“我们过去的技术,无论是硬膜外还是硬膜下的电极,本质上都是在开颅后,对大脑特定区域的神经元进行‘点对点’的接触式读写。但这忽略了大脑最迷人的特性——它是一个复杂的网络,其整体功能远大于局部之和。”

基于这一认知,彭雷联合创立了“格式塔科技”。“格式塔”一词源于心理学,意为“整体大于部分之和”。他认为,要真正理解认知、记忆、情感等高级功能,就必须从一个更宏观、更整体的视角来观察和干预大脑。在他看来,超声波脑机接口具备这样的技术潜力。

与需要开颅手术的电学方法不同,超声波技术利用相控阵原理,能够将能量无创地穿透颅骨,精准聚焦于大脑内部的任意位置,无论是表层皮层还是深部核团,实现对神经元的兴奋或抑制调控。

在“读取”大脑信号方面,超声波另辟蹊径。它不直接读取电信号,而是通过功能性超声成像(fUS)技术,捕捉神经元活动时周围血流信号的变化。“人脑中血管总长度超过100万公里,血流的动态变化与神经活动高度相关,”彭雷说,“读取血流信号,意味着我们可以从一个更宽广的全脑维度,解码大脑的意图。”

他透露,这一技术路线正迅速成为全球科技巨头的新战场。从Neuralink核心成员的出走创业,到近期OpenAI创始人山姆·奥特曼高调成立超声波脑机接口实验室,都预示着一个巨大风口的到来。

演讲的最后,彭雷展示了超声波脑机接口从理论走向应用的巨大潜力。他介绍,格式塔科技正在开发从大型台架式到未来可穿戴式的两代产品,旨在将神经调控从院内延伸至院外甚至家庭场景。

他表示,对于慢性疼痛患者,初步临床研究显示,30分钟的无创治疗可使其疼痛程度显著下降50%,效果持续一周以上;对于中风康复,超声调控有望保护受损神经元,改善预后;在抑郁症、焦虑症等精神类疾病治疗上,它为功能性失调的“对症下药”提供了新工具;此外,它还能暂时性地打开血脑屏障,为脑胶质瘤、阿尔茨海默病等顽疾的新药研发打造一个高效的药物递送平台。

“我们深信,随着超声波带来的海量全脑数据不断积累,神经科学领域或许将迎来自己的‘Transformer时刻’,诞生一个全新的大脑基础模型(Foundation Model)。”彭雷展望道,“这不仅将彻底改变我们理解和治疗大脑的方式,更将加速人工智能与人类智能的融合,推动人类走向那个我们曾经预测的、碳基与硅基智能共生的未来。”

观察|春晚舞台成为2026年人形机器人集体竞技第一站

2026年人形机器人竞争的第一声号角,正在春晚的舞台吹响。

近日,多家人形机器人企业接连官宣,将亮相马年春晚。就在央视春晚前,智元和京东也先后举办了各自的机器人晚会,各家机器人企业都将“春晚”视为一个争夺眼球、吸引资本与合作机会的“赛点”。

国家地方共建人形机器人创新中心首席科学家江磊日前向澎湃科技记者(www.thepaper.cn)表示,2026年会成为人形机器人行业的分水岭。国内大约80%的整机企业仍处于研究机器人平台阶段,对训练场、数据集及大模型等底层能力建设持观望态度,这类企业将在当前竞争态势下面临巨大风险。

换句话说,舞台上的热闹很可能只是表象;舞台背后下一轮洗牌,已经开始酝酿。摆在所有企业面前的并不是“谁跳得更齐、谁更会摆造型”的问题,而是更严肃的竞争逻辑:谁能证明自己具备持续迭代、规模交付与落地能力,谁才配坐上下一轮的牌桌。

春晚是“秀场”,也是“战场”

相较于去年,今年的春晚表演舞台机器人的含量“浓度”直线上升。

据澎湃科技不完全统计,截至2月11日,已有7家企业通过官宣或权威彩排信息确认参与春晚舞台,比如魔法原子是2026春晚智能机器人战略合作伙伴,16台机器人将在北京主会场参与多场景表演;银河通用机器人今年首次参与春晚舞台,作为此次春晚舞台指定的具身大模型机器人企业,将为北京主会场提供具身大模型技术支撑。宇树科技已是春晚舞台上表演的“回头客”,将参与北京主会场《骐骥新姿》节目表演,参演产品为G1/H1人形机器人。松延动力的人形机器人也将在春晚舞台完成首次登台。

除了人形机器人企业,科大讯飞将在合肥分会场参与表演,新松机器人的SR210A重载机械臂将在沈阳分会场参演。

这些企业正试图通过春晚建立品牌护城河。

智元创新(上海)科技股份有限公司合伙人、高级副总裁、具身业务部总裁姚卯青此前在接受澎湃科技采访时曾明确提到,2025年是衡量人形机器人企业能不能在牌桌上站稳脚跟的年份,2026年人形机器人企业会分化,一定会出现人形机器人企业第一梯队,“是不是三家不好说,可能还是在10家以内。”

在经历过估值飙升与短视频出圈的热潮后,机器人行业已进入残酷的去泡沫期。

“非它不可”的场景还在探索中

洗牌之所以不可避免,核心在于人形机器人商业化落地依然太难,人形机器人目前还没找到那个“非它不可”的场景。

目前人形机器人落地前三大场景集中在物流仓储、工业场景和商场导览/接待/文娱表演类。尽管看似场景丰富,但它们能展现的水平还回答不了一个问题:到底在什么场景下,必须用人形机器人?

科大讯飞机器人超脑平台总经理刘可为认为,场景的模糊性驱使行业陷入“让机器人更像人” 的极致追求,却因技术、供应链要求过高陷入 “面面俱到,面面不全” 的困境。在实际应用中,一旦机器人出现一次失误,用户的信任就可能归零。

一位机器人头部企业的技术战略官也对澎湃科技表示,2026年人形机器人行业变化会很大,可能会有一些公司倒掉,也可能有公司在场景落地上做得更丰富。但在场景竞争下,头部公司一定会优先抢占那些“好做的场景”,或者干脆把产品做到足够好,只有这两条路才能走得下去。

对于“跳舞”表演这类场景,前述人士认为,跳舞只要机器人本体能力足够好就能成立,但跳得好不代表有市场。“一个本地厂家起来以后,谁会选择用你来跳舞?关键还是有没有具备大批量出货的能力。如果已经能实现规模交付,在后续迭代中,优势会越来越明显。”

姚卯青也呼吁在政策端推动场景开放。机器人普遍需要训练,而现有的部分场景方不愿意让还处于早期的行业进入场景。

“这就会陷入鸡生蛋蛋生鸡的悖论,机器人不进场就没有数据与反馈,行业更难成熟,更不敢进场”。姚卯青建议通过政策鼓励场景方开放,对那些愿意先行先试、敢于“吃螃蟹”的主体给予补贴或真金白银支持,“只有这样,才能把冷启动拉进正循环。”

不成熟的供应链

尽管2025年人形机器人实现了从实验室到产业现场的跨越,甚至出现了亿元级别的订单,但人形机器人的“出货量”不能避而不谈。

2026年1月,行业围绕“谁是2025年出货量第一”出现了明显争议。

市场研究机构 Omdia 和CounterPoint Research给出一组出货预估数据,称智元 2025 年人形机器人出货量为 5168 台、位列第一,并对宇树给出约 4200 台的估算。

随后宇树科技在官方微信公众号公开澄清,并给出自己的口径:2025 年纯人形机器人“实际出货(出售并发货到终端客户)”超过 5500 台,同期量产下线超过 6500 台;同时强调机器人形态多样,不应把双臂轮式等其他形态产品与“纯人形”直接合并对比。

从全球视角看,热度与人形机器人出货量规模之间的落差同样明显。权威机器人行业媒体The Robot Report最新发布的《2026年机器人行业展望》报告中指出,2025年人形机器人领域完成了463轮融资、150多家公司入场,估值飙升了300%,但实际出货量仅同比增长17%。

有科技投资人向澎湃科技感慨,现有的人形机器人出货量还远远不够。

江磊认为,对于人形机器人整机企业来说,现在更像是在做“消费级产品储备”,年产量现阶段不敢超过一万台,因为“产太多没有用途、售后压力也会非常大”。

无论是商业展演还是工厂试用,人形机器人都还没形成能自我造血、可复制的商业闭环。高昂的设备维护成本、不可避免的损耗以及极低的复购率,使得机器人的销售规模目前还难以覆盖长期的研发与运营投入。 “亿元订单”和“规模交付”,还只是迈出了商业化长征第一步。

供应链成熟度是制约规模化量产的关键问题。姚卯青在接受澎湃科技采访时明确提及,团队“踩到最大的坑”,是对产业供应链不成熟、不完备的程度预估不足,机器人的供应链、产业链比原先预想的还要不成熟;可能还需要再经过2026年一整年的推进,关键零部件才会出现相对成熟、标准化的方案。

只相当于6岁孩子的大脑

近两年,人形机器人的进步更多体现在“小脑”,即运动控制上,能走能跑能跳。但决定它是否真正有用的“大脑”智能决策部分,仍是当前人形机器人最大的短板。有财经媒体透露,现实中,不少人形机器人本体企业在AI大脑层面的投入依然很少,现阶段仍依托阿里、字节等科技大厂的通用大模型赋能。

江磊曾在接受澎湃科技采访时旗帜鲜明地表示,“对于人形机器人产业来说,最缺的并不是人形结构,而是有内容的大脑。”“现在(人形机器人)的大脑只相当于6岁小孩。”江磊认为,大脑不够成熟,抑制了人形机器人的产能,即便人形机器人的产能提高也没有用途。

围绕“大脑”如何提升,当前行业内有几条并行竞争的主流技术路线,包括端到端VLA(Vision-language-Action)路线、模仿学习(IL)、强化学习和世界模型等,但在这些路线之中,哪一条更可能通向“通用”智能现在仍无定论,争议也最集中在被寄予厚望的端到端 VLA 上。

清华大学自动化系教授赵明国曾在访谈中尖锐指出,行业热捧的VLA(视觉-语言-动作)模型更多是过渡性的技术手段,而非终极方案”。他认为,大语言模型的成功,源于人类语言数据的“标准化”与“海量”,但物理世界的视觉、触觉数据“非常不规范”,想简单照搬大模型那套逻辑,“是行不通的”。

与该观点相呼应的是,国内具身智能创业公司灵初智能联合创始人陈源培认为,具身智能真正的难点不在于如何炫酷的Demo或是模型架构,而在于能不能撑起百万小时规模的数据积累。“数据量不够,模型层面的操作没有任何意义,调整架构带来的成功率没有价值。”

这揭示了一个深层困境:我们缺的或许不只是算力,更是对物理世界交互逻辑的根本理解。

《2026年机器人行业展望》指出,未来将会有更多公司宣布关停或被“收购式招聘”(acqui-hire),原因往往是它们无法展现足够的商业增长势头,从而难以支撑下一轮融资。未来 12 个月正在酝酿成为机器人行业又一个具有变革意义的年份。

2026年这场预期的洗牌,与其说是寒冬,不如说是一次挤掉泡沫、回归实干的必然过程。在场景不明、模式不通、智能不足的三重考验下,唯有能同时回答好这三个问题的企业,才可能穿越周期,带领人形机器人真正走向未来。

具身智能赛道依然火爆,两天诞生了两家百亿独角兽

2月24日,国内具身智能初创企业千寻智能(杭州)科技有限公司(以下简称“千寻智能”)宣布连续完成两轮融资,总额近20亿。随着本轮融资落地,千寻智能估值突破百亿,正式跻身具身智能赛道 “百亿俱乐部” 核心成员。

就在前一天,智平方(深圳)科技有限公司(以下简称“智平方”)宣布完成超10亿元B轮融资,估值同样迈过百亿门槛。

马年开年,具身智能赛道接连诞生两家百亿估值企业。

千寻智能

千寻智能成立于2024年1月,核心团队由原珞石机器人联合创始人及CTO韩峰涛与清华大学交叉信息学院助理教授高阳领衔。

该公司称,其自研的Spirit v1.5模型,成为首个在性能上超越美国具身智能公司开源的模型Pi0.5的中国开源模型。数据方面,千寻智能提出的“数据金字塔”训练理念,目前已累计获取超20万小时多类型真实交互数据,通过自研的可穿戴式数采设备,将数据成本降至传统方式的1/10。

2025年12月,千寻智能全球首条人形具身智能产线在宁德时代中州基地投运,旗下人形机器人小墨作为核心设备,实现近千块电池零故障量产,作业节拍与熟练工人相当;小墨机器人目前也已入驻京东零售场景,用于讲解互动与产品操作演示。

智平方成立于2023年4月,创始人郭彦东为国家级创新领军人才,曾任微软美国总部、小鹏汽车及OPPO核心研发岗位。该公司一年累计完成12轮融资,围绕自研的大模型GOVLA(全域全身VLA大模型)打造的AlphaBot(爱宝)系列机器人,在两年内完成三代迭代。据了解,目前爱宝机器人已在工业柔性制造、公共服务及新零售领域实现落地。

智平方

对于此轮系列融资资金,智平方相关负责人表示接下来将重点保持GOVLA具身大模型能力的技术迭代升级,让机器人的“大脑”越来越聪明。在迭代大脑的基础上,驱动AlphaBot(爱宝)系列机器人产品迭代与产线扩容。

澎湃科技梳理发现,2026年春节前后,具身智能投融资热度仍在延续,至少有七家与具身智能产业链直接相关的企业披露融资进展,覆盖机器人本体(硬件平台)、具身“大脑”(VLA/具身大模型、学习与控制算法),以及支撑闭环落地的数据、工具链与场景系统能力等环节。

2月10日,专注具身智能大脑公司穹彻智能宣布完成数亿元A轮融资;2月11日,定位智能机器人解决方案公司星海图完成近10亿元B轮融资,累计融资额近30亿元,估值百亿元;2月13日,成立仅10天的智元旗下、定位具身智能数据服务平台型企业觅蜂科技宣布完成数亿元种子轮与天使轮融资;2月14日,聚焦构建机器人“通用大脑”与“操作智能”创业公司无界动力宣布完成超2亿元天使+轮融资,与此同时,第三轮融资已接近完成,累计融资额将达8亿元;同日,定位机器人大脑研发商、清华系具身智能大脑公司千诀科技在两个月内完成Pre-A++轮融资。

当资金不再集中于单一叙事,而是在“本体能力”与“具身大脑/系统能力”之间同步加注,具身智能的投融资逻辑正在发生变化。资本关注的焦点正从“谁能讲故事”,转向“谁能构建完整能力体系与真实场景闭环”。

“6G机器人”亮相2026MWC

电信-智元酷拓联合展示的6G四足机器人现场 来源:智元

“6G对于四足机器人或机器人而言,最不可替代的价值是在‘没有人的地方’。”3月3日,智元酷拓COO邱恒在接受包括澎湃科技(www.thepaper.cn)在内的媒体采访时表示。在2026年世界移动通信大会(MWC)开幕之际,智元机器人与中国电信首次公开展示“6G+四足机器人”联合创新成果,依托6G网络的通感一体与泛在连接能力,智能机器人的活动半径将从地面拓展至地下、无人区等极端复杂环境中。

6G即第六代移动通信技术,支持更高的传输速率、极低的延迟。与5G相比,6G不仅实现了峰值速率50-200 Gbps、空口时延低至0.1-1 ms的跨越式提升,更新增了通感一体、AI原生、厘米级高精度定位等变革性能力。与过往通信代际升级不同,6G被视为与人工智能深度融合的技术平台。在核设施内部、深海油气平台、月球表面基地等人类难以抵达或无法常驻的区域,6G赋能的具身智能体或将发挥作用。

中国机电一体化技术应用协会也指出,人类社会正迎来“泛机器人化”时代,机器人技术正与社会生产生活的各领域深度融合,而6G正是激活这一“泛机器人社会”的神经中枢。当通信网络覆盖从二维平面升维至三维立体,当机器人获得全天候、全地形的自主作业能力,人类对物理空间的认知与利用将发生质变。

邱恒称,当前四足机器人已经能在工业领域、安防领域、应急救援特种作业和文娱商业领域等广泛落地。未来,四足机器人与6G结合后可能拓展的应用场景更加广泛,尤其是一些人类不适合前往的区域。是“在有人的地方,5G已经可以解决相当一部分问题,6G能够进一步增强;在没有人的地方,搭载6G可能解决的是‘从无到有’的问题。”邱恒说,他判断,6G+智元系四足机器人有望在2029或2030年赶上第一波商业化落地潮,届时不仅机器人的智能能有大的跃升,价格也会下降很多。

智元彭志辉:2026具身智能进入“部署态”元年

2月28日,2026人形机器人与具身智能标准化(HEIS)年会在北京举行。工业和信息化部人形机器人与具身智能标准化技术委员会副主任委员、智元机器人联合创始人、总裁兼CTO彭志辉(稚晖君)在演讲中表示,具身智能行业目前进入了下半场,2026年人形机器人迎来“部署态”元年。“整个具身智能行业目前还在共同探索,没有任何一家企业能独自给出正确答案。”彭志辉开篇直言,“我们需要协力攻破瓶颈,在正确的时间做正确的事。”

谈及产业现状,他援引工信部数据称:“国内人形机器人整机企业已超140家,发布产品达330款,行业已从实验室炫技、Demo展示,进入工程化、场景化竞争的下半场。”他回忆,2024年到2025年初,行业焦点还在比拼机器人走路是否自然,如今已能完成“飞檐走壁”般的高难度动作。“本体灵活性已达到实用化阶段,接下来要比的,是谁的干活能力更强。不仅在国内比,更要与海外头部企业比,看谁能在‘部署态’真正落地。”

彭志辉认为当前人形机器人的最佳切入点是“在简单场景做复杂任务”。“比如在结构化的工厂环境里,执行高自由度、高维感知的复杂操作。”他分析道,虽然自动驾驶是在复杂环境下做简单任务,但人形机器人与自动驾驶的终局是一致的,即在复杂环境下完成复杂任务,“目前我们已在文娱商演、工业制造、物流分拣、安防巡检等八大典型场景展开应用,只有真实场景才是验证可靠性、迭代系统的最有效途径。”

谈及为何坚持“人形”路线的底层逻辑,彭志辉给出了一个形象的比喻:“Computer Use(电脑使用)是数字世界的人形接口,而人形机器人就是物理世界的通用接口。”他解释说,正如现有的软件系统是为鼠标键盘设计的一样,整个物理世界——从门把手高度到工具形态——都是为人类身体设计的。“既然环境是围绕人类构建的,那么AI要实现最大化的通用性和兼容性,其终端形态大概率也要长得像人。它未必是效率最高的,但一定是兼容性最强的。”他预判,未来人形机器人走进家庭时,产业规模将是“手机数量乘以汽车价格”的级别。

作为标委会副主任委员,彭志辉最后呼吁行业共建标准体系。“具身智能的终局是基础设施,而非单点产品。”他表示,“物理AI规模化的关键在于数据闭环、可靠性工程以及可运维能力的标准化。我们既要跑得快,也要跑得稳。智元愿将一线实践中的数据治理方法、评测体系和运维经验与行业共享,共同加速物理AI的系统性落地。通用能力的突破肯定来自全行业的产业迁移与生态共建,而标准化正是这一过程的加速器。”

智元机器人联合创始人、总裁兼CTO彭志辉(稚晖君)。

以下为彭志辉在2026人形机器人与具身智能标准化(HEIS)年会上的演讲全文:

我们整个行业目前还在共同探索,目前没有任何一家企业可以说自己独自给出正确答案。我们要大家一起协力攻破这些瓶颈。今天我个人经过三年的阶段性探索,想以实践者的身份汇报我们智元对于行业发展的一些思考。首先一个实际问题,具身智能可能是下一次工业革命的重要引擎,革命成功的关键是要在正确的时间做正确的事情。很多人会问为什么是现在,为什么人形机器人这两年突然成为风口。

根本原因是AI技术的发展带来的突破。从2015年可以看到,以深度学习为代表的分析式AI带来了感知智能;到2022年开始,以超级大模型为代表的生成式AI引领了认知智能;到今天我们正处在下一个重大转折点,就是由AI加机器人驱动的物理智慧世界正在加速到来。

我们定义的具身智能,是能在真实世界里面完成感知、决策、行动、学习一个完整闭环的通用智能体,也就是所谓的通用智能体。回顾过去几年,我们人类完成了数字AI的规模化。过去这几年AI进化速度呈爆炸式发展,DPC(编者注:DeepSeek的模型简称)马上也要发新模型了,大家可能觉得DPC已经是很久以前的事情,其实才一年。整个大语言模型开始,大家的视野慢慢打开,也才3年时间。

最近,从Agent到MCP到Q,再到Open Cloud,几乎每个月都有颠覆性进展。大模型集群、海量数据、开发者生态,这一切都在让AI在屏幕里、在云端变得无所不能。这也让大家自然而然地会往它的延长线上去看,什么时候AI能够在物理世界发挥巨大价值,能够帮我们干活。这就是我们未来十年要挑战的更难命题,完成物理AI的规模化,从数字AI走向物理AI。正如我们从功能手机走向智能手机的转变,通用机器人区别于之前的专用机器人,不再局限于单一任务,而是能够灵活适应多种不同工作场景,进行广泛应用。通用机器人代表着具身技术的一种更为先进的通用形态,能够通过AI赋能,实现自主学习、多任务切换、长程任务的环境适应等。这种从专用到通用的跨越,为未来各行各业的应用带来了巨大可能性。

今天是标委会的年会,我也想回应一些政策背景。计算行业的蓬勃发展,离不开国家政策的支持。第一个是国家的战略窗口目前已经完全打开,人形机器人被纳入推动未来产业创新发展的重点方向。工信部规划清晰,到2025年实现批量生产,2027年完成具有国际竞争力的生态格局,这就是我们所依托的作战地图。第二点是产业侧信号非常强烈。

今年1月21日,工信部在国信办发布会上披露的数据显示,国内人形机器人整机企业已经超过140家,发布的产品达330款。这意味着整个行业已经从实验室里的炫技、做Demo,正式进入工程化竞争、场景化竞争的下半场。2024年到2025年初,大家还在比拼谁家的机器人走路更直、更自然,到现在我们已经能实现机器人飞檐走壁,人能做的工作机器人能做,人做不了的工作机器人也能做。本体的灵活性已经达到一定的实用性阶段,接下来我们要比谁的干活能力更强,不仅在国内比,还要跟海外具身智能头部企业比,看谁能在部署态真正落地。具体到企业实践,我们智元总结出一套可落地的工程范式——一体三智。

首先是一体,一体指的是本体。在数字世界,代码跑错了可以重新跑、可以重启,但在物理世界有物理成本,有失效成本。本体是AI在真实世界的约束接口,真实的物理世界非常复杂,充满了各种随机的摩擦、碰撞、形变、误差、老化、噪声等。所以本体的设计,不只是简单的硬件堆叠,更是可靠性工程、供应链工程和安全工程的综合体。

当前本体最核心、最重要的两个零部件,一个是关节,决定了本体的运动能力上限;一个是灵巧手,决定了它的操作能力上限,这两个部件也占据了整机成本的绝大部分。

行业早期,机器人的执行器有很多不同的探索路径,比如基于液压驱动、基于高速比高刚度的斜波驱动、类似四缸的直线驱动等。但从2023年开始,整个执行器的方案都收敛到了新型关节。人形机器人的硬件技术和新能源车非常类似,这也是很多车企布局机器人领域的原因。

其中最核心的就是所谓的三电系统,三电系统里面的电机和电控,在机器人系统中体现为一体化的关节。

区别于汽车的点在于,一方面功放不一样。机器人的自由度和任务空间远比汽车复杂,汽车的电机工况相对简单,基本是单向输出,而机器人需要进行高动态、高频的正反转,所以功放不同。另一方面,汽车自由度相对低,只有方向盘、油门等,而机器人全身一般少则数十个、多则上百个运动自由度,如果算上手的话,自由度会更多。

更关键的是,机器人不同关节部位的各种规格指标差距非常大,动态范围非常广。比如手指的扭矩和大腿的扭矩,需求完全不在一个量级。但机器人自由度高,不可能为每个关节单独设计一款对应规格的产品,这会是量产的灾难。所以如何科学做好关节系列化规划,是一个标准化流程,也是非常考验系统设计能力的一点。比如我们在实践中,把所有产品线将近10款产品、五大系列,全部规整到8款系列化关节设计上,这8款关节用在我们所有产品上,能够满足所有部位的关节需求。

这就是系列化、标准化带来的收益。灵巧手也是一个复杂度非常高的核心零件,它的难点一方面是需要把10~20个自由度的运动部件结构,塞进比人手手掌还小的空间;另一方面是对灵巧手的高维感知能力要求非常高,最典型的就是触觉。

触觉在工业干活领域落地起核心作用。我们分析过大量工业作业场景,也实地走访客户、去工厂看每个工人的操作,得出的结论是,接近80%人类做得好、传统自动化做得不好的工序,都和触觉有强相关。比如装配,很多流水线上的工人会通过手感,也就是触觉把两个东西拼起来,听到咔嚓一声就知道装配好了。这种咔嚓一声怎么用数字描述,怎么和传感器信号对应起来,就是触觉能体现价值的地方。但这里的瓶颈在于,触觉传感器的技术路径还没有收敛,没有标准化。我们对比视觉,视觉是先有标准的传感器技术,比如CCD、CMOS,再有标准的数据格式,比如JPG等,然后有标准的数据集,比如非常有名的ImageNet,之后才催生了各种深度学习模型的百花齐放,最终在各个场景广泛应用,这就是标准的价值。当前触觉在传感器层面还没有形成标准,硬件也没有收敛,比如有基于电容的、基于电感的、基于压电效应的,还有基于其他技术的。

这是目前的一个瓶颈,我们也在这方面投入了大量研发精力,希望未来能看到好的收效。如果说硬件是躯体,那AI就是机器人的灵魂。我们现在把机器人的灵魂主要分为三个领域,就是运动智能、交互智能、作业智能。2024年以来,整个行业包括学术界、工业界,在运控领域的进步肉眼可见。这主要得益于三个方面:一是整体算法范式的转变,从传统的模型驱动,也就是所谓的NPC,到后来强化学习RL的范式转变;二是类似于SSA这种仿真框架的普及,使得大规模并行仿真和训练成为可能;三是前面提到的关节技术收敛,新型关节带来的低难度控制模式。这些综合收益,使得我们整体的运动智能得到突破性提升。

运动智能是交互智能和作业智能的基座,为人形机器人提供自主自由移动和全身动作的基础能力。在运动智能基础上,交互智能和作业智能分别提供情绪价值和生产力价值。

同时,各种复杂动作的实现,对模型训练要求非常高,需要非常专业的AI背景和实操训练技巧,才能实现一些复杂动作。我们为了进一步降低模型训练难度、降低开发门槛,以此丰富创作内容,提出从最早的科研教育实验室的开发态,走向创作态,最终到部署态。针对创作态,我们开发了一些好用的工具链,比如去年发布的灵创平台,它把整个基础动作训练的流程简化到只需上传一个视频。就像抖音一样,拍一段人类跳舞或者做各种任务的视频,上传到我们平台,它会自动完成动作关键点检测、动作迁移、IL训练、推理部署等所有流程,实现全自动化,这是一个非常好的降低应用门槛的工具。

第二个智能是交互智能。未来的机器人不能只听懂语音指令,目前语音指令的实现还不够完善,它需要从语音指令转向多模态的感知和协作。比如它看到你的时候,能感受到你的情绪、听懂你的语气,甚至能提前预判你的意图。交互智能的意义在于,我们希望打造出真正可沟通、可信赖的机器人伙伴。这种情绪价值的意义比很多人想象的要大得多,大家看春晚的机器人表演,就是在为大家提供情绪价值。

这一点不仅对用户有价值,很多用户也愿意为它买单、付费。对于交互智能而言,它可以提供可交互的情绪价值。这一块很大程度可以复用现在大语言模型的成果,目前国内外的大模型,智商和情商都已经非常高,还能形成多模态情感识别,我们在机器人上可以直接复用这部分能力。但也有区别,比如模态的升级,现在我们使用的各种AI助手,缺失机器人所需要的一些模态,比如肢体动作、表情等。

因为我们的产品线非常多,所以希望通过一套标准化流程,形成能力复用、数据回流、模型进化、产品升级的正向循环。同时我们也相信,技术的终极应该是开放的,生态的力量肯定远大于单点突破,我们一家的突破远远不够。所以我们也在构建一个开放共享、持续进化的生态,比如我们有很多开源的动作。包括具身智能领域的安卓系统,我们叫灵渠OS,这个操作系统也是我们开源的;还有业界最大的真机数据集,也是我们在2023年底开源的,英伟达很多模型也用了我们这个数据集。

有了技术之后,我们也希望匹配到合理、合适的场景里面去落地。不同阶段的技术成熟度,会匹配到不同的落地场景,这就是所谓的沿途下蛋的思路。我们选择场景会遵循一些原则,比如把任务维度分为两个维度,一个是场景的复杂度,一个是任务本身的操作复杂度。场景复杂度实际上是一种约束,不体现价值,是一种障碍;任务的复杂度能够体现价值。

一个典型的例子,比如自动驾驶,就是在复杂的环境下做简单的任务。它的任务非常简单,就是从A点到B点,中间只有方向盘和油门,自由度非常低,但环境是非常复杂、开放的。

我们机器人现在正在做的事情,其实是在简单场景做复杂任务。比如在工厂里面的约束化、结构化环境中,做的任务非常复杂,自由度非常高,还要涉及高维感知和一些长程任务。

自动驾驶和现在的具身智能,都会走向最终的目标,就是在复杂环境下做复杂任务,真正替代人类的大部分工作。这是我们长期选择的一个原则。

基于这个原则,我们现在已经在8大典型场景里面,开展了非常多的应用。这里需要强调的是,我们不认为自己找到的场景是绝对正确、唯一的选择,而是确信真实的场景才是训练系统、验证可靠性的最有效市场。所以机器人一定要在真实场景里面去跑,收集数据、循环迭代,才有可能实现技术和应用的突破。

最后我想聊一下为什么我们会这么执着于人形形态。这里的关键逻辑在于,整个物理世界就是为人类设计的,人形机器人之所以有望成为未来的智能基础设施,不是因为它长得像人,而是因为它是第一次把情绪价值和劳动生产力,统一到同一个可规模化、可进化的物理终端载体中。我们可以举一个最近的例子,大家都知道“问界到小龙虾”非常火。2025年底大家还在讨论哪个模型更聪明、哪个模型编程能力更强,但到了2026年初,这个话题几乎迅速收敛到一个关键词,就是Computer Use,也就是电脑的使用。简单说就是让机器人能够自己操作电脑,比如下载文件,它能自己操作电脑、自动化完成任务。

最早掀起这股趋势的是Open Cloud,它推出的所谓CoCo模式。随着“小龙虾”(OpenClaw)项目的开源,这个项目进一步点燃了整个社区的热度。其实模型能力的比拼也开始转向,从最早的智力指标,现在开始转向执行能力。

单纯分析这个事情,从纯技术效率的角度来看,让AI通过模拟鼠标和键盘的方式操作电脑,显然不是最优解。因为理论上最优的方式,应该是让AI直接生成目标的二进制代码,直接生成代码在电脑上跑,绕开图形界面和人为交互。但现实的问题在于,现在所有的软件系统、操作系统,整个数字生态都是为人类设计的,都是为鼠标和键盘这样的交互模式设计的。正因如此,操作电脑反而成为一种高度通用的接口层,它不是最优效率的路径,但却是覆盖最广的执行通路。

回到人形机器人的事情上,逻辑是一样的。我们的物理世界,各种建筑、工具、设备、交通系统,都是为人类的身体设计和实现的。比如门把手的高度、楼梯的尺寸、工具的把握形态、工具流的组织方式等,本质上都假设了一个人类形态的操作者。所以从数字AI到物理AI,应该也存在一条清晰的进化路径。既然整个环境是围绕人类构建的,那么AI如果要实现最大化的通用性和兼容性,最终的终端形态,大概率也要长得像人类。

换句话说,Computer Use是数字世界里的人形接口,人形机器人就是物理世界里的通用接口。它们可能未必是最高效的平台,但肯定是全世界最具兼容性的载体。回顾历史上的几个重要交互终端,PC和手机,它们连接的都是人和数字世界,未来的人形机器人,连接的是人与物理世界本身。

这也是为什么说我们在参与时代级的基础设施革命。我觉得未来机器人真正走进家庭的时候,整个人形机器人的产业规模一定非常巨大,我们认为它是一个手机数量乘以汽车价格的产业空间。前景非常广阔,但挑战也非常大。

同时再回到标准上,这不仅仅是技术问题,物理AI的社会接受度也取决于它的安全、隐私、网络、数据、伦理治理等,这些都要形成标准。

所以我们既要跑得快,也要跑得稳;既要采用一些新技术,也要守住产业底线,这就是我们建立标准的意义。

最后我想用三句话结束今天的分享:第一,具身智能的中局是基础设施,而非单点产品;第二,物理AI规模化的关键在于数据闭环、可靠性工程、可运维能力等形成标准;第三,人形机器人通用能力的突破,肯定来自全行业的产业迁移和生态共建。标准化不仅是技术规范,更是产业落地的加速器。未来我们智元非常愿意把一线实践中的一些数据处理方法、评测体系、运维经验,和整个行业一起沉淀为可复用的方法论,共同加速把AI系统性地引入物理世界。