当前,人形机器人产业已步入商业化落地的初级阶段,产业技术从实验室走向市场验证,并形成数据驱动逻辑下的主流技术路径。相关市场主体 “大而全”“小而全”的发展策略弊端日益凸显,亟待转变发展思路,强化前瞻性视野和战略性思维,从技术、标准、资源、政策等多角度构建一体化产业技术生态,以稳健的技术生态优势应对不确定性,促进人形机器人产业健康发展。
一、商业化拐点将至,产业技术走向市场验证
在技术和市场的双重驱动下,人形机器人已开始步入商业化落地的初级阶段,其相关技术也面临从实验室研发转向产业化应用的关键转型。
1. 人形机器人商业化落地加速
2024年已被业界普遍定义为“人形机器人商业化元年”,首届中国人形机器人产业大会发布的《人形机器人产业研究报告》显示,2024年中国人形机器人市场规模预计达到27.6亿元,并有望在2030年成长为千亿元市场。全球市场也显示出强劲的增长动力,国际投资银行高盛预测,到2035年人形机器人市场规模有望达到1540亿美元。当前,原型产品正从模拟训练进入场景实训。工业制造和物流仓储领域成为优先突破场景,行业领军企业已经开始部署实训。如特斯拉在美国俄勒冈州开设了机器人制造工厂“RoboFab”,并计划在2025年交付部分Optimus产品。此外,零售服务、家庭服务、科研服务等领域也作为潜在市场开展特定场景应用。
2. 产业技术从实验室走向市场验证
得益于现代工业机器人的行业奠基,加之AI技术突破带来的智能化渗透,人形机器人正加速样机迭代,加速从简单操作到复杂任务执行、从单一功能到多功能集成的转变。当前,国内外龙头企业纷纷加大人形机器人产业布局力度,相关技术正经历从实验室研发向产业化应用的关键过渡。如特斯拉以控制软件和算法为核心,构建AI生态并加快从智能汽车向人形机器人的移植;OpenAI以ChatGPT为核心,投资Figure AI和1X等通用人形机器人企业;英伟达立足算力平台与芯片,为波士顿动力、傅里叶智能、小鹏机器人等人形机器人企业提供模型算力支持;华为探索构建“华为赋能”和“华为智选”人形机器人生态。在机器人具身智能能力建设的进程中,需要突破结构、关节、运动、感知、认知和决策等多环节挑战,面临技术可实现性、资源可获得性、主体可协同性和成本可接纳性等多重约束和考验。
二、数据驱动渐成主流,技术路径日益明朗
人形机器人产业技术的发展,既继承了工业机器人相关技术,又在AI技术的推动下,展现出颠覆性创新态势。在经历了多轮范式变迁与模式比选后,以数据为核心来构建产品或服务的运作逻辑渐成主流,并形成决策机制、系统架构和支撑资源三层次技术路径。
1. 部署思路:“自动”向“自主”的范式转型
当前,智能系统的决策机制正逐步从规则驱动的“模块化”走向数据驱动的“端到端”模式,进而促使智能化部署从“自动化的部件协同”升级为“自主化的整体行动”。
传统智能决策机制是一种基于规则驱动的“模块化”架构,即将感知、定位、决策、控制等任务拆分为多个独立模块,通过逻辑规则驱动功能实现,通过接口传递完成工作协同。随着深度学习技术的发展,基于数据驱动的“端到端(end to end)”架构开始出现,其将智能系统视为一个整体,通过多模态的神经网络模型直接从输入的传感器数据生成最终的决策和控制信号。相对于“模块化”架构,“端到端”架构更加贴近人类行为模式,可实现数据输入到决策输出的无缝衔接,不仅提高了系统的性能上限,还具备更强的泛化和复杂场景适应能力。其首先应用于自动驾驶领域,英伟达、特斯拉最先掀起“端到端”的自动驾驶变革,百度、华为和以“蔚小理”为代表的造车新势力均开始布局“端到端”自动驾驶方案。鉴于该架构的高度可移植性,“端到端”架构在机器人导航和任务执行中也开始逐步应用。例如,特斯拉的Optimus机器人和谷歌的RT-2项目均采用了“端到端”模型,实现了高效、灵活的多任务处理;Figure AI与OpenAI合作开发的Figure 01机器人也展示了“端到端”如何转变机器人决策逻辑。在“端到端”架构日益成为业界共识的背景下,其核心能力储备和掣肘因素破解也应及时提上日程。模型优化、数据质量、算法创新以及算力提升,这些共同构成了提升“端到端”技术成熟度的核心要素。同时,为了有效破除模型复杂度高、可解释性差等挑战,对相关资源的深度挖掘与协同布局,需引起更多关注与切实行动。
2. 系统架构:“渐进”与“颠覆”的动态平衡
近年来,作为部署思路的核心载体,系统架构从萌芽走向成熟。其技术路径主要分为两类:即基于工业机器人的“渐进式改良”与基于生成式AI的“颠覆式创新”。伴随技术供给和产业需求的深入磨合,路线之争也逐渐从并驾齐驱走向动态平衡。
一方面,模型构建从“大小之争”走向“通专结合”。长期以来,工业机器人领域通常采用小模型来满足感知、运动、控制等特定任务的需求,这些小模型在硬件资源有限的机器人本体上运行,确保可靠性和稳定性。然而,随着AI大模型的发展,越来越多的厂商开始探索如何纳入通用大模型和行业垂直大模型,更好地解决工业领域的特定问题。尽管如此,大模型当前存在的专业认知缺乏、算力资源不足、幻觉现象突出等问题,使其应用于工业领域仍面临可靠性和成本等挑战,需要在“通用性”和“专业化”之间找到平衡点。
另一方面,运算路径从“云端计算”走向“云边结合”。传统的机器人系统多依赖于云端计算,以利用强大的算力进行复杂任务处理。随着边缘计算技术的发展,越来越多的计算任务被转移到边缘设备上,以减少延迟并提高实时响应能力。例如,Meta、谷歌、高通、英伟达等都致力于推动边缘AI发展,云边协同架构也在车路运一体化的智能驾驶、智能仓库巡检机器人等领域开始被应用,以实现高效的数据处理、实时决策和系统优化。
3. 支撑资源:“私有”与“公共”的互为渗透
人形机器人运行涉及软硬件环节众多,应用覆盖广泛,传感、控制、执行及人机交互等领域的功能实现都将依赖于大规模算力、数据及训练场景支撑。尽管领军企业已加大布局力度,但独自承担所有环节已不现实,未来必然趋向公共与私有部门携手合作,共建共享资源体系。
一是算力资源从“个体部署”走向“集群共享”。传统的分散自主部署算力模式存在周期长、高能耗、利用率低等诸多弊端,且当前面临出口管制限制与国产替代缓慢等现实问题。面向算力需求的爆炸式增长和AI算力芯片的超短期迭代,算力建设也必将走向集约化和网络化,实现算力、数据、算法等资源的流动共享。通过集群共享的方式,可以实现算力资源的高效复用和按需分配,从而显著提升资源利用率,降低算力成本。同时,在集群形态上,算力网络将成为主要的供给方式,通过连接分散的算力资源,实现多中心资源聚合和多元异构算力的融合。例如,英伟达算RiseVAST平台通过虚拟化技术实现了异构算力集群的混合部署、统一调度和管理,支持多任务共享同一显卡,从而提升硬件使用效率并降低算力成本。特斯拉的DOJO智算中心将实现100,000PFlops算力,相当于约30万块英伟达A100的算力总和。在这一大背景下,协同推进AI算力芯片产业的发展与智算集群的共建共享,是有效解决算力荒、算力弱、算力贵的关键突破口。
二是数据资源从“结构化”走向“非结构化”。随着业务场景的改变,算据资源正在从基于数据库的结构化数据向非结构化数据转变。根据IDC的统计分析,文本、图像、视频等非结构化数据占整体数据量的比重高达80%以上,且以每年55%~65%的速度增长。同时,生成式AI技术的发展也推动了非结构化数据的应用,使得基于非结构化数据进行模型调优和决策支持成为可能。例如,亚马逊已开始通过Textract等工具处理大量非结构化文本数据,以支持其云服务和数据分析需求;IBM的Watson人工智能平台,正在通过自然语言处理和机器学习技术,将结构化和非结构化数据转化为有价值的洞察。这意味着,未来应用于人形机器人的AI推理和训练算据很大程度上将以非结构化数据为主,并基于其辅助AI算法优化,这要求相关部门在推动非结构化数据源的整合、促进技术创新应用及完善多源数据治理体系等方面加强前瞻性部署。
三是场景资源从“实体训练”走向“虚实融合”。早期的人工智能训练场景以实地为主,存在时空受限、成本高昂、环境单一、安全风险等弊端。虚拟环境训练的引入,显著提升了训练效率和降低训练成本,并缓解了AI算力短缺和真实训练数据缺乏问题。例如,英伟达的Omniverse软件实现了虚拟世界的物理级仿真和渲染,并在Omniverse基础模型之上,研发出Isaac专用模拟训练机器人研发平台。再比如,由卡内基大学、斯坦福大学等近20家全球顶尖高校实验室联合研发的生成式物理引擎Genesis,通过综合性物理仿真平台自动生成多场景物理模拟,为机器人虚拟环境训练提供强大支持。此外,特斯拉通过构建虚拟仿真空间和快速标注技术,为规控算法的训练与验证提供高自由度的环境。这些技术的应用表明,虚拟环境训练将是未来的重要趋势之一,相关部门需要在训练阶段定义、场景分级认证、伦理和合规性认定等方面加快前期部署。
三、分散竞争弊端显现,一体化生态亟待先行
随着科研与产业界的深入合作,上述技术路径已逐步从实验室阶段迈向中等规模的实际场景验证,这一进展无疑为人形机器人的产业化进程注入积极信号。但也应看到,当前相关市场主体仍处于“春秋战国”的分散竞争格局中(注:国家地方共建人形机器人创新中心统计,截至2024年11月,国内外通用人形机器人整机商业公司约150家,国内超过80家,国内的人形机器人整机商业公司中有半数来自高校的学生和教师创业。),尚未就产品定义、产业构成及行业标准达成共识,对于产业链、供应链以及创新链之间的协同路径,也缺乏明确的认识。这种状况极易导致各主体采取“大而全”“小而全”的发展策略,不仅增加了产业化进程中的不确定性,还可能导致重复投资与重复建设,造成资源浪费,相关各方只有共同认识到问题所在,方能有效破局。
1. 软硬件标准尚不统一,系统衔接与供应链搭建面临较多堵点
尽管当前已有近百家企业参与人形机器人产业,但软硬件技术仍面临快速迭代和选型之争,标准尚未统一,导致供应链效率低下和成本增加。
一是软硬件标准化问题。人形机器人的核心硬件多数处于从发展期到成熟期的过渡阶段,而脑机接口等更先进的技术则刚从萌芽期过渡到发展期,硬件层面仍存在较多痛点,并导致供应链上游操作系统和工业控制PLC面临部件、质量要求等不统一,不利于形成规模和成本控制。
二是“云边端”一体化问题。新型运算模式决定了云边协同面临着数据安全与隐私保护、网络拓扑的动态变化以及设备异构性等问题,需要优化计算任务分配机制和安全体系等来提升整体效能。同时,不同行业对边缘计算部署的要求各不相同,导致开放接口、数据格式、传输协议等方面存在较大差异,亟待建立面向共性领域的统一方案和针对细分领域的标准参照,以减少大量重复验证和适配成本。
2. 模型进展差异较大,协调成本和协同缺口较大
适配人形机器人的通用大模型基础仍处于早期阶段,小模型虽然具备工业机器人领域的技术积淀,但面向运动协调和复杂场景的性能要求上仍具有较大差距,大小模型、新旧体系之间的协调成本和协同缺口仍然较大。
一是大模型瓶颈仍未有效突破。目前,国内大模型研发为人形机器人的感知、决策和交互能力提供了一定技术支撑,但底层架构和算法框架仍大多依赖国外技术,其高昂的成本、较低的可靠度、薄弱的泛化能力和尚未成熟的产业链,对商业化落地造成一定阻碍。同时,“百模大战”催生无序竞争不仅浪费了大量资源,还可能引发行业内的恶性竞争。
二是小模型性能提升面临限制。小模型精度和可靠性更高,但缺少真实的理解力,在处理复杂任务时仍难以达到人形机器人运动所需要的性能。此外,针对特定应用场景的定制化开发,还面临数据稀缺、标注质量和算力受限等问题,尤其是在某些专业领域,低通用性与高开发成本的矛盾已日益突出。
3. 计算资源协同不足,数据和算法共享困境突出
人形机器人需要处理复杂的感知、决策和运动控制任务,这些任务对计算资源的要求非常高。面向数据与算力的集群布局,产业界和政府部门都在着手推进,但共建共享面临的技术与制度瓶颈依然较为突出。
一是数据共享和流通面临障碍。人形机器人市场化落地需要大规模高质量数据供给,但由于数据产权界定仍不明确,分级分类的数据使用规则和安全机制仍不明晰,导致数据共享与流通的规则仍然相对缺失。数据用户不得不采用大量人力进行数据采集,这不仅成本高昂,而且效率低下。
二是算力资源管理模式有待变革。随着大模型的发展,对算力的需求呈指数级增长,但智算中心的利用率却极为有限,调查显示智算中心机房出租率普遍仅有20%~30%之间,暴露出行业的结构性问题。一方面,国内算力和智算中心在高速发展的同时,技术选型和系统架构滞后问题却较为突出,高级算力涉及的网络架构、任务调度及智能运维等能力并没有同步增长。另一方面,使用端尚未完全理解大模型训练深层次需求,简单的“堆卡”行为不足以应对实际算力要求。这种供需错配导致了智算中心过剩与大模型算力紧缺的矛盾,需要从顶层设计、技术路径和协作模式等多方面入手,推动算力资源的有效配置和高效利用。
4. 跨界合作面临挑战,场景分散与行业割裂较为突出
目前,人形机器人尚未在下游终端应用领域实现规模化商业落地,部分核心零部件在人形机器人领域的应用也未得到充分验证。主要原因是人形机器人行业应用中仍面临路线分歧和场景割裂的问题。
一是场景分散,难以支撑应用规模。人形机器人在商业化场景的开发应用上还处于探索阶段,小规模应用难以达到投入产出效能指标,大规模应用如工业场景则面临稳定性、可靠性的多重挑战。上述情况,不仅限制了人形机器人的技术迭代和性能提升,反过来进一步限制了其需求刚性和商业化进程。
二是行业割裂,跨界合作创新渠道不畅。人形机器人主机厂商在行业推广中仍面临诸多挑战。一方面,由于商业化合作机制不完善,导致资源与场景的互联互通难以实现。另一方面,由于相关领域法规仍不健全,企业在虚拟训练和场景共享等方面仍面临“法无明确不敢为”的困境,导致合规成本过高。
四、统筹部署技术生态,巧筑优势应对变局
尽管竞争态势激烈,但总体而言,人形机器人产业的技术生态仍处于初创期,亟待市场配置资源的决定性作用与更好发挥政府作用的深度融合。面对市场的不确定性,积极强化人形机器人产业技术生态的科学布局,是抢占行业领先地位、优化市场利益结构和捍卫国家产业安全的应有之举。预见技术演进趋势,洞察产业配置逻辑,
1. 立足关键定义,加强国际标准输出
一是顺应技术路径演进趋势,推进标准路线图匹配。基于数据驱动逻辑下的人形机器人技术演进趋势,积极整合电子电气、自动化控制、人工智能等多个学科领域的专业学会力量,组建跨学科专题研究小组,加快制定面向未来的人形机器人标准路线图,分析识别关键领域的标准空白点并针对性地提出标准预研方案。强化与国际相关领域标准化机构协作,提升在国际标准制定中的影响力和引领性。
二是聚焦功能、智能、性能,强化软硬件标准布局。当前,国家有关部委针对人形机器人领域已经启动了基础标准计划,并着手构建具身智能的标准体系。在此基础上,需充分利用国家与地方共建的人形机器人创新中心以及本市标准化协会的资源优势,聚焦功能特性、智能水平及性能指标等核心要素,进一步深化垂直行业内软硬件标准体系的布局。同时,积极向国际标准化组织提议设立新的人形机器人技术标准委员会,旨在加速人形机器人通用标准的国际化进程和输出能力,为整合产业链优势奠定发展基础。
2. 立足渐进迭代,推动系统架构转型
一是推进工业机器人与人形机器人技术路径融合。应超越技术路线之争,充分利用各自在形态结构、运动控制和应用场景方面的独特优势,整合工业机器人标准化、稳定性特点和人形机器人通用性、泛化性能力,通过技术融合实现互补发展。积极鼓励并支持工业机器人与人形机器人领域的领军企业组建创新联合体,强化关键技术研发与核心产品创新的协同合作,加快形成完整的产业链和创新链。
二是强化“大、小”“云、端”协同部署。立足《人形机器人创新发展指导意见》提出的打造“大脑”和“小脑”的目标,推动系统架构协同部署。通过推动人工智能、信息通信、计算服务相关机构联合研发,优化模型架构衔接、深化端云协同部署,推动大模型和小模型走“通专结合”发展道路。进一步强化人工智能研发机构与产业界的紧密合作,共同挖掘并创建通专融合技术在多元领域的应用场景潜力,鼓励各方根据市场需求及自身核心竞争力,灵活选择并推动示范性商业模式落地。
3. 立足融合共享,创新资源配置模式
一是积极发展虚实融合训练场景体系。技术端方面,应强化多模态数据标准、训练系统和深度强化学习技术的融合,开发基于云平台虚实融合测试系统,构建相关数据交互协议,提升生成复杂场景的能力。产业端方面,应同步构建虚实融合测试标准体系和政策体系,推动新型研发机构和公共技术平台加大虚实结合测试场景的的多元化开发。
二是推动智算集群集约化协同化建设。顺应通用型人工智能应用态势,适度超前布局超算智算基础设施,注重芯片、服务器、操作系统等关键算力部件的国产化替代,构建基于异构计算架构的自主软硬件生态。同时,聚焦产业链区域化布局,推动长三角地区数据中心一体化布局和算力跨区域调度,加快构建“产算协同、数算融合、跨域辐射”的集约化智算公共网络。
4. 立足联动赋能,构建产业飞轮范式
一是推动技术产业化合作创新,构建产业飞轮原动力。重点围绕人工智能、深度学习、视觉传感、空间智能等核心技术,进一步发挥政府对基础研究和技术创新的支撑作用,以专项基金、产业基金等方式支持产学研联合研究项目开展,强化各方在市场需求、行业数据、AI模型、AI算力、传感器、电控单元、系统总成等领域的优势,集中共建产业链生态。
二是推动场景协同开发和拓展,构建产业飞轮自驱力。进一步发挥政府在工业、医疗健康、交通物流、社会服务等行业的信息集成和转型促进职能,建立常态化、多通道供需对接平台,探索构建政务服务、城市治理领域应用场景率先开放机制,鼓励人形机器人相关新模式、新服务和新业态孕育。
三是推动基于要素的扶持政策,形成产业飞轮补给力。突破传统分行业管理模式,聚焦数据、技术、人才、标准等关键要素,立足产业链上下游联动赋能,推动数据流动集成、共性技术开发、科学设施装置、开源模型系统、虚实融合场景、复合人才认定等一揽子配套政策,推动技术生态要素的可持续供给。
(作者徐珺系上海发展战略研究所副所长,正高级工程师)
发表评论