http://kadhoai.com.cn 2026-04-25 12:22:42 來源:中國信息化周報
當談到具身智能時,大多數不明就裏的人往往會問:具(ju)身(shen)智(zhi)能(neng)是(shi)否(fou)就(jiu)等(deng)於(yu)人(ren)形(xing)機(ji)器(qi)人(ren)?因(yin)為(wei)人(ren)形(xing)機(ji)器(qi)人(ren)被(bei)廣(guang)泛(fan)提(ti)及(ji),熱(re)度(du)也(ye)最(zui)高(gao)。其(qi)實(shi)不(bu)然(ran),從(cong)技(ji)術(shu)的(de)角(jiao)度(du)來(lai)講(jiang),具(ju)身(shen)智(zhi)能(neng)是(shi)指(zhi)通(tong)過(guo)物(wu)理(li)實(shi)體(ti)與(yu)周(zhou)圍(wei)環(huan)境(jing)進(jin)行(xing)互(hu)動(dong),從(cong)而(er)不(bu)斷(duan)增(zeng)長(chang)智(zhi)能(neng)的(de)係(xi)統(tong)。它不僅僅局限於人形機器人,而是指任何能在空間中移動的有形智能機器。
對此,華為雲盤古大模型CTO李寅解釋道,具身智能是一個更寬泛的概念,能夠與不同的硬件本體結合,包括但不限於人形機器人、特種機器人、機械臂、無人機、無人船等。
三種主流技術路線
北京智源人工智能研究院研究員王業全表示,目前,以人形機器人為代表的具身智能包含三個要點:一是智能化;二是運動控製;sanshibenti。qizhong,duiyuzhinenghuaeryan,duandaoduanshimuqiandezhuliujishuluxian。tabiaoshi,zidongjiashilingyu,duandaoduandejishuluxianbeishiweitongxianggaojibiezidongjiashideguanjian。ciwai,danao+小腦也是智能化技術路線中的重要組成部分,其本質是模仿人類,大腦主要負責高級認知功能,包括思維、記憶、情感等,小腦主要負責運動控製方麵的功能。
在(zai)運(yun)動(dong)控(kong)製(zhi)技(ji)術(shu)路(lu)線(xian)中(zhong),強(qiang)化(hua)學(xue)習(xi)發(fa)揮(hui)了(le)巨(ju)大(da)作(zuo)用(yong),能(neng)夠(gou)使(shi)機(ji)器(qi)人(ren)通(tong)過(guo)與(yu)環(huan)境(jing)的(de)交(jiao)互(hu)學(xue)習(xi)最(zui)優(you)的(de)行(xing)為(wei)策(ce)略(lve),但(dan)存(cun)在(zai)數(shu)據(ju)獲(huo)取(qu)成(cheng)本(ben)較(jiao)高(gao),且(qie)獎(jiang)勵(li)信(xin)號(hao)對(dui)運(yun)動(dong)影(ying)響(xiang)大(da)的(de)問(wen)題(ti)。“ruguodajiayongguoshimianshangdeduozhongjiqiren,huifaxianyouxiejiqirendejiaobushengyinhenqing,youxiejiqirenjiaobushengyinhenzhong。zhisuoyichuxianzhezhongxianxiang,kenengshiyinweixunlianmoxingxiangguankongzhicelveshi,guanzhugengduodeshijiqirennengfouwendingxingzou,erbushijiaobudeqingyuzhong。zheshiqianghuaxuexiluxiandetedian,gengkanzhong‘獎勵’和‘懲罰’,設置什麼‘獎懲’目標,就會帶來對應的效果。”王業全解釋道。
除chu此ci之zhi外wai,模mo仿fang學xue習xi也ye是shi運yun動dong控kong製zhi的de重zhong要yao技ji術shu路lu線xian。王wang業ye全quan表biao示shi,人ren類lei是shi具ju備bei智zhi能neng的de,具ju身shen智zhi能neng人ren形xing機ji器qi人ren就jiu是shi對dui人ren類lei的de模mo仿fang,在zai這zhe種zhong情qing況kuang下xia,讓rang機ji器qi人ren像xiang人ren是shi一yi條tiao可ke行xing之zhi路lu。這zhe一yi思si路lu沒mei有you問wen題ti,但dan是shi實shi踐jian麵mian臨lin頗po多duo問wen題ti。
強(qiang)化(hua)學(xue)習(xi)和(he)模(mo)仿(fang)學(xue)習(xi)都(dou)有(you)各(ge)自(zi)的(de)優(you)缺(que)點(dian),那(na)如(ru)果(guo)將(jiang)二(er)者(zhe)結(jie)合(he)起(qi)來(lai),形(xing)成(cheng)強(qiang)強(qiang)聯(lian)合(he)是(shi)不(bu)是(shi)一(yi)種(zhong)更(geng)好(hao)的(de)思(si)路(lu)呢(ne)?對(dui)此(ci),王(wang)業(ye)全(quan)表(biao)示(shi),目(mu)前(qian)科(ke)研(yan)界(jie)正(zheng)在(zai)探(tan)索(suo)將(jiang)強(qiang)化(hua)學(xue)習(xi)和(he)模(mo)仿(fang)學(xue)習(xi)的(de)優(you)點(dian)結(jie)合(he)起(qi)來(lai)。
在本體技術路線中,本體電動驅動是主流方案,其好處是響應速度、控(kong)製(zhi)精(jing)度(du)和(he)靜(jing)音(yin)性(xing)較(jiao)好(hao),缺(que)點(dian)是(shi)成(cheng)本(ben)比(bi)較(jiao)高(gao)。王(wang)業(ye)全(quan)舉(ju)例(li)說(shuo)道(dao),波(bo)士(shi)頓(dun)動(dong)力(li)基(ji)於(yu)液(ye)壓(ya)驅(qu)動(dong)做(zuo)了(le)大(da)量(liang)工(gong)作(zuo),取(qu)得(de)了(le)非(fei)常(chang)好(hao)的(de)效(xiao)果(guo)。液(ye)壓(ya)驅(qu)動(dong)的(de)好(hao)處(chu)是(shi)輸(shu)出(chu)功(gong)率(lv)高(gao)、xuhangxingnenghao,bingqienenggoufuzhong,quedianshizaoyinjiaoda,qinglianghuajiaonan。ciwai,wangyequanhaibiaoshi,chudiandongqudongheyeyaqudongfangshizhiwai,haiyouqidongqudonghuoqitadequdongfangshi,muqianhaichuyushiyanshitansuojieduan。
產業應用需循序漸進
王wang業ye全quan表biao示shi,從cong應ying用yong的de角jiao度du來lai說shuo,具ju身shen智zhi能neng有you非fei常chang龐pang大da的de場chang景jing和he領ling域yu,但dan對dui能neng力li要yao求qiu很hen高gao。從cong短duan期qi來lai看kan,具ju身shen智zhi能neng的de部bu分fen重zhong點dian能neng力li可ke能neng產chan生sheng一yi定ding的de突tu破po並bing且qie聚ju焦jiao於yu特te定ding垂chui類lei場chang景jing。長chang期qi來lai看kan,具ju身shen智zhi能neng一yi定ding會hui進jin入ru通tong用yong化hua的de發fa展zhan階jie段duan,這zhe樣yang才cai可ke能neng達da到dao機ji器qi人ren具ju備bei類lei人ren智zhi能neng的de長chang期qi目mu標biao。
李寅表示,2024年,具身智能技術剛開始出現之後,政府的賦能作用可能更為凸顯,就是通過扶持科研機構、高校以及初創企業做一些場景的創新和孵化。2025年到2026年,當具身智能開始更多涉及產業落地時,應該從一些比較成熟的場景中去找到具身智能的落地計劃。2027年之後,具身智能可能會實現從工業到家用的規模複製,此時具身智能才可能真正走進人們的生產和生活。
對(dui)此(ci),中(zhong)興(xing)通(tong)訊(xun)股(gu)份(fen)有(you)限(xian)公(gong)司(si)機(ji)器(qi)人(ren)產(chan)品(pin)總(zong)工(gong)張(zhang)慧(hui)說(shuo)的(de)更(geng)為(wei)具(ju)體(ti)。她(ta)表(biao)示(shi),談(tan)到(dao)具(ju)身(shen)智(zhi)能(neng),更(geng)多(duo)的(de)是(shi)麵(mian)向(xiang)非(fei)結(jie)構(gou)化(hua)和(he)柔(rou)性(xing)化(hua)的(de)場(chang)景(jing)。在(zai)當(dang)前(qian)的(de)技(ji)術(shu)背(bei)景(jing)下(xia),工(gong)業(ye)領(ling)域(yu)可(ke)以(yi)更(geng)快(kuai)地(di)實(shi)現(xian)應(ying)用(yong),因(yin)為(wei)工(gong)業(ye)領(ling)域(yu)不(bu)僅(jin)存(cun)在(zai)很(hen)多(duo)人(ren)為(wei)限(xian)定(ding)的(de)非(fei)結(jie)構(gou)化(hua)場(chang)景(jing),柔(rou)性(xing)化(hua)的(de)場(chang)景(jing)種(zhong)類(lei)也(ye)是(shi)有(you)限(xian)的(de)。在(zai)工(gong)業(ye)領(ling)域(yu)積(ji)累(lei)更(geng)多(duo)能(neng)力(li)之(zhi)後(hou),再(zai)麵(mian)向(xiang)商(shang)業(ye)場(chang)景(jing)、生活場景等泛化性要求更高的場景去做應用。
具體來看,在工業領域中,物料分揀、柔性上下料、倉儲物流因需求迫切、場景可控,可能成為最先落地方向。例如,巨一科技聚焦 SMT 物料分選與大型生產現場物流配送,預計1年內實現應用;中興通訊關注電子元器件分揀與單板插拔,海信則探索展廳講解與大件物料上下料。而在商業服務領域中,導購、清潔、前台接待等場景需求明確,短期內可實現。
從可用到好用的挑戰
2022年之前,具身智能往往麵臨單一的任務、單一的場景和單一的本體,大模型出現之後,具身智能盡管能解決多種任務,跨越不同本體,麵對不同場景,但也存在不好用、不易用、不通用的科學難題,需要研究更加“聰明”的大腦模型和跨本體的大小腦結構框架,來實現跨本體、跨場景、可泛化的具身智能。
李寅表示,當前,具身智能與物理世界的精準交互,對大模型提出了更高要求。像盤古和DeepSeekdengyuyanleimoxing,jiejuedeshicongganzhidaorenzhi,zaidaojuecedewenti,bingmeiyoujiejuejingshenhuosiweicengmianshangdewenti,congerwufashixianyuwulishijiedezhenzhengjiaohu。shijishang,ganzhi、認知、決策的下一步應該是執行,執行就涉及到與物理世界的交互,隻有具身智能和大模型的結合才有可能解決這一問題。
在具身智能落地應用的過程中,李寅認為存在三大難點:一(yi)是(shi)數(shu)據(ju)嚴(yan)重(zhong)不(bu)足(zu)。她(ta)表(biao)示(shi),工(gong)業(ye)產(chan)線(xian)大(da)多(duo)數(shu)是(shi)半(ban)結(jie)構(gou)化(hua)或(huo)半(ban)標(biao)準(zhun)化(hua)的(de)場(chang)景(jing),盡(jin)管(guan)它(ta)與(yu)泛(fan)化(hua)性(xing)要(yao)求(qiu)更(geng)高(gao)的(de)家(jia)用(yong)場(chang)景(jing)有(you)一(yi)定(ding)區(qu)別(bie),但(dan)即(ji)使(shi)完(wan)成(cheng)在(zai)大(da)家(jia)看(kan)來(lai)很(hen)簡(jian)單(dan)的(de)操(cao)作(zuo),對(dui)具(ju)身(shen)智(zhi)能(neng)來(lai)說(shuo)也(ye)是(shi)非(fei)常(chang)複(fu)雜(za)的(de)長(chang)程(cheng)任(ren)務(wu)。例(li)如(ru),在(zai)手(shou)機(ji)裝(zhuang)配(pei)線(xian)上(shang),將(jiang)手(shou)機(ji)、電源線、手機膜、說明書等統一放在一個包裝盒中,就是目前行業內正在攻關的一個技術難點。目前,解決這些問題所需要的數據依然是稀缺的。
二er是shi模mo型xing。李li寅yin表biao示shi,目mu前qian,具ju身shen智zhi能neng模mo型xing百bai花hua齊qi放fang,到dao底di最zui終zhong的de模mo型xing應ying該gai做zuo成cheng什shen麼me樣yang,才cai能neng讓rang這zhe個ge模mo型xing具ju備bei強qiang大da的de推tui理li能neng力li,能neng夠gou理li解jie真zhen實shi世shi界jie複fu雜za的de環huan境jing並bing且qie準zhun確que的de執zhi行xing任ren務wu,而er且qie還hai具ju備bei一yi定ding的de魯lu棒bang性xing和he泛fan化hua性xing,這zhe也ye是shi具ju身shen智zhi能neng麵mian臨lin的de技ji術shu難nan點dian。
sanshijushenzhinengzaichanyeyingyongzhongbujinyaomianduibutongdelingyuhechangjing,renwuleixingyejiqisuipianhua。zaizhezhongqingkuangxia,ruguoyaoxianglianhedazaojushenzhinengxitong,jiuxuyaotigongwanzhengdegongjulian,zheyeshijidaitupodeyigenandian。
王業全表示,一方麵,目前的大模型還無法滿足具身智能對於視、聽、說、想、做多種模態聯合建模的要求,另一方麵,還不具備自我認知、類人記憶以及人物識別等能力。此外,在相關的技術路線中,無論是VLA路線還是其他路線都存在數據成本極高、泛化性不好的問題。“傳統機器人開發遵循‘控製設計-算法實現-仿真調試’流程,具身智能時代轉向‘數據驅動+ 模型訓練’,需解決異構數據標準化、模型積木式組合等問題。”國家地方共建人形機器人創新中心劉宇飛如是說。
不僅如此,在操作智能方麵,還需攻克成功率、穩定性與魯棒性難題,並且能夠有效應對光照變化、工件差異及環境振動等環境的幹擾。此外,動態平衡與多機器人一致性,情感表達、意圖理解、語音交互的自然性,以及軟硬件的工程化問題也亟待解決。
weilai,quanmotaidamoxingyidinghuichengweijushenzhinengdehexin。zaijushenzhinengfazhanyanjindeguochengzhong,wulunshiquanmiandehuanjingganzhinengli,haishiwusundexinxibuhuonengli、類人的思考能力、泛化能力以及一致、準確、合理的行為輸出,對於具身智能來說都是需要具備的。隻有具備這些能力,才能更快地實現從可用到好用的跨越。