http://kadhoai.com.cn 2026-04-25 07:04:49 來源:第一財經
不同硬件、不同大腦,不同機器人廠商進入不同場景,在多方變量的加持下,機器人的規模化落地似乎遙遙無期。
9月17日,第一財經記者在采訪第三方部署方、機器人本體廠商和場景落地方時發現,一個行業新角色正在出現。一個類似於安卓操作係統的中間算法層正在承擔屏蔽硬件差異、兼容不同大腦架構的功能,為機器人在真實場景中的規模化落地提供可能。
如今,這一產業角色已經吸引了穀歌、智元、富臨精工、格力博、東土科技、巨星新材料等企業押注。但在硬件廠商堅持自家體係、大模型企業追逐通用智能的格局下,行業的“安卓時刻”何時到來,仍有待市場與現實工況的雙重檢驗。
機器人湧入場景,跨本體訓練遇阻
當機器人廠商湧向場景方,新的問題正在出現。
“這個月至少有兩家機器人公司正在和我們談合作。”Kelvinshichangsanjiaoyijiawuliushangshigongsidejishufuzeren,tagaosujizhe,weileherenxingjiqirenchangshangjinxinghezuo,zijibudebubochuyigebarenzuoyoudetuanduihebutongjiqirenqiyejinxingduijie。“我們需要開放不同的數據接口,提供一個專門的實驗場景,還需要根據各家機器人的要求不斷調整流程和測試參數”。
在大量的人力和物力投入之外,Kelvin坦言自己算不過來ROI(Return on Investment,投資回報率)。“機器的工作效率不穩定,且運維需要大量後續的費用。”他向第一財經記者透露,物流企業馬上就會備戰“雙11”時間,在此期間是否繼續讓機器人上崗,他還在猶豫。
更大的問題是,由於不同廠商的機器人算法不兼容、硬件各自封閉,導致一個場景的成功經驗難以遷移到另一個場景。“有的時候我們的流水線哪怕是多一個彎折,機器人都需要重新走一輪POC(Proof of Concept,概念驗證)。”
“廠商覺得我們不夠開放,我們覺得機器人廠商要得太多。”Kelvin說,這是產業上下遊之間對接存在的普遍問題。第一財經記者了解到,一些“中間人”的de角jiao色se正zheng在zai產chan業ye鏈lian中zhong誕dan生sheng。前qian上shang汽qi自zi動dong駕jia駛shi域yu控kong製zhi器qi算suan法fa負fu責ze人ren,安an努nu智zhi能neng工gong程cheng算suan法fa總zong監jian楊yang曾zeng告gao訴su記ji者zhe,團tuan隊dui正zheng在zai研yan發fa的de一yi套tao中zhong間jian件jian算suan法fa平ping台tai,希xi望wang像xiang手shou機ji裏li的de操cao作zuo係xi統tong一yi樣yang,把ba不bu同tong廠chang商shang的de機ji器qi人ren納na入ru統tong一yi的de兼jian容rong框kuang架jia。
就jiu像xiang手shou機ji的de操cao作zuo係xi統tong讓rang不bu同tong軟ruan件jian在zai同tong一yi套tao規gui則ze下xia運yun轉zhuan一yi樣yang,中zhong間jian件jian希xi望wang能neng夠gou通tong過guo屏ping蔽bi底di層ceng硬ying件jian差cha異yi,使shi一yi套tao算suan法fa能neng夠gou遷qian移yi到dao不bu同tong廠chang商shang的de機ji器qi人ren上shang。“如果每遇到一個新的硬件,就要重新訓練,機器人在實際場景部署的速度就會非常慢。”重(zhong)慶(qing)大(da)學(xue)助(zhu)理(li)教(jiao)授(shou),人(ren)工(gong)智(zhi)能(neng)及(ji)多(duo)模(mo)態(tai)實(shi)驗(yan)室(shi)具(ju)身(shen)智(zhi)能(neng)負(fu)責(ze)人(ren),安(an)努(nu)智(zhi)能(neng)首(shou)席(xi)科(ke)學(xue)家(jia)胡(hu)喆(喆)告(gao)訴(su)第(di)一(yi)財(cai)經(jing)記(ji)者(zhe),想(xiang)要(yao)提(ti)高(gao)機(ji)器(qi)人(ren)的(de)通(tong)用(yong)化(hua),跨(kua)本(ben)體(ti)是(shi)必(bi)須(xu)跨(kua)過(guo)的(de)門(men)檻(kan)。
在不改動模型本身的前提下,兼容不同機器人的大腦,成為中間件的挑戰。“雖然主流的模型是VLA模型(Vision-Language-Action Model,視覺-語言-動作模型),但其中的架構仍然不同,有端到端,也有分層式。”胡喆說,中間件在機器人大腦和機器人作業的實際場景中充當一個“翻譯官”的角色。在他的設想裏,輸出的指令會先被中間件被轉化為統一的目標和約束,再交由各家機器人自身的規劃控製器執行。
“這樣我們就不必為每一個新廠商重新訓練模型,隻需要向每一個機器人的規劃控製器下達指令,就能讓中間件跑通整個流程。”胡喆說。

物理規律難仿真,機器人“幹中學”
“我們曾經試過,在實驗室裏跑通了所有算法,結果到實際場景中發現完全不是一回事兒。”鈦維雲創的創始人張磊告訴記者,當自己試圖讓機器人處理布料這樣的柔性物體時,由於布料材質、厚薄、摩擦力不同,實驗室的環境並不能完全滿足操作需要。
張磊透露,像布料、不規則包裹等物體,POC周期“很長,且難以給出確切的時間”,“因為我們需要提前磨合算法、下線采集數據、再拿到實驗室反複訓練,才能勉強適配場景”。
工廠中的物料、工藝成千上萬,換一條生產線、換一個工位,都可能帶來完全不同的情況。
“離線的強化學習不可能把所有真實場景一網打盡。”hu喆gaosudiyicaijingjizhe,jiqirenbujinxuyaogenjuchangjingfanfutiaoshisuanfa,haiwangwangyaozhongxincaijishujuhuidaoshiyanshizuolixianxunlian,zherangzhenggezhouqibeilachang,shijianherenlidoubeidaliangxiaohao。
邊做邊改,或許才是機器人進行學習的關鍵。
胡hu喆喆透tou露lu,他ta正zheng在zai嚐chang試shi利li用yong實shi時shi的de在zai線xian學xue習xi算suan法fa,允yun許xu機ji器qi人ren在zai實shi際ji作zuo業ye過guo程cheng中zhong一yi邊bian操cao作zuo一yi邊bian采cai集ji數shu據ju,並bing實shi時shi更geng新xin模mo型xing。這zhe種zhong方fang式shi隻zhi需xu在zai現xian場chang額e外wai增zeng加jia幾ji秒miao鍾zhong運yun行xing和he100個數據量,“我們會根據模型出來的結果選擇數據,讓機器人在不斷學習的過程中遺忘無用的數據,保持數據的精簡,也不會對算力提出過多的要求”。
機器人“幹中學”的另一邊,團隊也在嚐試利用仿真等手段降低機器人的學習成本。“現在大部分機器人仿真環境離現實工況還有很大差距,因為仿真環境中缺乏物理定律的支撐。”美國肯塔基大學空氣動力實驗室仿真負責人、安努智能聯席科學家付博直言,大部分仿真平台依賴數據驅動,卻缺乏物理定律的支撐。
“如果隻是換個環境光影、物體形狀等表層變量,那在這種仿真裏能跑通的算法,一旦放到現實中,往往會失效。”付博說。
讓虛擬環境逼近真實世界,並不是一件容易的事。“摩擦力、空氣流動等連續變化的環境很難被拆成可以極端的小單元。”付博解釋,以機器人搬箱子舉例,這個場景涉及了力學、剛(gang)體(ti)運(yun)動(dong)學(xue)與(yu)工(gong)程(cheng)力(li)學(xue)等(deng)基(ji)本(ben)的(de)物(wu)理(li)規(gui)律(lv)。付(fu)博(bo)說(shuo),加(jia)入(ru)這(zhe)些(xie)規(gui)律(lv)的(de)仿(fang)真(zhen)能(neng)夠(gou)模(mo)擬(ni)不(bu)同(tong)重(zhong)量(liang)箱(xiang)子(zi)堆(dui)疊(die)時(shi)的(de)微(wei)小(xiao)形(xing)變(bian),計(ji)算(suan)箱(xiang)內(nei)散(san)落(luo)零(ling)件(jian)導(dao)致(zhi)的(de)重(zhong)心(xin)偏(pian)移(yi),並(bing)讓(rang)機(ji)器(qi)人(ren)理(li)解(jie)物(wu)體(ti)變(bian)化(hua)對(dui)抓(zhua)取(qu)穩(wen)定(ding)性(xing)的(de)影(ying)響(xiang),以(yi)及(ji)機(ji)器(qi)人(ren)發(fa)力(li)點(dian)與(yu)物(wu)體(ti)形(xing)變(bian)的(de)關(guan)聯(lian)。
他坦言,將這些物理定律的融入仿真環境是一個“正在進行的過程”,需xu逐zhu步bu攻gong克ke計ji算suan量liang龐pang大da的de技ji術shu難nan題ti。付fu博bo認ren為wei,隻zhi有you當dang機ji器qi人ren在zai仿fang真zhen環huan境jing中zhong充chong分fen理li解jie並bing內nei化hua這zhe些xie物wu理li規gui律lv,才cai能neng在zai真zhen實shi場chang景jing中zhong更geng好hao地di應ying對dui突tu發fa情qing況kuang,實shi現xian泛fan化hua能neng力li的de提ti升sheng。“模型永遠無法完全替代實驗,但我們希望通過極致的物理仿真,讓真實實驗隻需做一次就能驗證可行性。”

安努智能、智元等團隊在富臨精工的工廠中進行部署。圖片來源:喬心怡
穀歌提前布局,中間件或成規模化關鍵
從機器人本體和大腦廠商到最終的應用企業,中間還需要大量複雜的部署工作——包括接口打通、場景適配、算法遷移等環節。對整個產業鏈而言,這是一塊頗具吸引力的“肥肉”,盯上的遠不止安努智能一家企業。
今年6月,銀河通用和博世中國成立合資公司博銀合創。根據雙方披露內容,合資公司將聚焦複雜裝配、智能質檢等高精度製造場景,並且構建標準化、模塊化、可複製的訓練與部署體係,支撐機器人產品的快速迭代與規模化部署。
今年年初,富臨精工宣布公司與智元機器人等相關方簽署了《人形機器人應用項目投資合作協議》,各方共同投資設立合資公司實施人形機器人項目。當前,富臨精工、智元、巨星新材料均為安努智能股東。就在9月,專注於北美市場的產業股東格力博、聚焦機器人操作係統的東土科技也宣布增資安努智能。
在海外,Google(穀歌)的母公司Alphabet孵化的Intrinsic也在扮演類似的角色。Intrinsic試圖通過通用算法和工具鏈降低機器人係統的集成成本,讓不同廠商的機器人在同一套兼容框架下運行。
tongguoyigeleisicaozuoxitongdezhongjianjianlaiduijiebutongjiqirenchangshanghechangjing,zheshiannuzhinengdongshichangwenhongjietichudejietisilu。suiranlujinggeyi,danshangshusanjiajianjujiqirenhechanyefangbeijingdedisanfangbushushang,tamendegongtongdiandoushishituzaisuipianhuadechanyegejuzhong,xunzhaoyitaonengkuayuechangshanghechangjingdejianrongfangshi。
不過,機器人產業是否會像手機產業那樣,最終走向由統一“操作係統”支撐的格局,仍充滿疑問。一位由數碼3Cxingyezhuanzhijiqirenchanyedegongchengshigaosudiyicaijingjizhe。yushoujichanyemianlindewentibutong,jiqirenlingyudeqingkuanggengweifuza,yingjianchangshangjianchigezidetixi,erdamoxingqiyezemiaozhuntongyongzhineng,“屁股決定腦袋,大家想的未必是同一個目標”。
多方角力之下,第三方部署商設想的中間件是否能夠建立起產業上下遊的橋梁,還需要進一步觀察。“模型如果停留在實驗室、本體如果隻會跳幾支舞,那最終隻是一個故事。”文宏傑認為,在當下的機器人產業,關鍵不是講模型和本體的“故事”,而是紮進具體場景,通過部署獲取真機數據和工程化經驗,將商業化的流程拉通、沉澱。
在他看來,這些工程化的經驗和數據才能彙聚成類似“操作係統”的底座,真正支撐機器人跨廠商、跨場景的落地。“如果中間件能夠像安卓這樣的操作係統一樣穩定通用、開放兼容,任何廠商都能接入,機器人產業的規模化會越來越近。”