http://kadhoai.com.cn 2026-05-06 13:40:30 來源:優必選科技
隨著具身智能技術持續迭代,人形機器人的場景認知、zhilinglijieyurenwuguihuanengliwenbutisheng,zhubujubeizaizhenshigongyechangjingluodiyingyongdejichunengli。danzaidongtaiduobiandechanxianshicaohuanjingzhong,xingyetongyongdechuantongjushenfanganrengcunzaimingxianduanban:多(duo)數(shu)模(mo)型(xing)隻(zhi)能(neng)基(ji)於(yu)實(shi)時(shi)場(chang)景(jing)完(wan)成(cheng)靜(jing)態(tai)決(jue)策(ce)與(yu)短(duan)程(cheng)任(ren)務(wu)拆(chai)解(jie),缺(que)少(shao)對(dui)物(wu)理(li)世(shi)界(jie)的(de)場(chang)景(jing)推(tui)演(yan)與(yu)未(wei)來(lai)狀(zhuang)態(tai)預(yu)判(pan)能(neng)力(li),難(nan)以(yi)適(shi)配(pei)真(zhen)實(shi)工(gong)業(ye)場(chang)景(jing)實(shi)時(shi)變(bian)化(hua)的(de)長(chang)程(cheng)任(ren)務(wu)作(zuo)業(ye)需(xu)求(qiu),導(dao)致(zhi)實(shi)現(xian)決(jue)策(ce)執(zhi)行(xing)與(yu)迭(die)代(dai)優(you)化(hua)的(de)全(quan)鏈(lian)路(lu)無(wu)法(fa)閉(bi)環(huan)。

優必選立足工業場景真實作業需求與具身智能技術演進方向,基於自研具身智能大模型Thinker,重磅推出全新具身智能世界模型Thinker-WM,打造物理AI基座,實現具身大腦架構與核心能力的全方位升級。憑借在空間泛化、長程任務和綜合性能上的優勢,Thinker-WM在權威具身智能評測基準 Libero 中登頂榜首。同時參與榜單排名的還有英偉達、Physical Intelligence、小米等知名公司的模型。
依托優必選在行業積累的數據及對模型架構的針對性優化,Thinker-WM構建了Diffusion Transformer統一多模態空間架構。模型在 Flow Matching 迭代演化過程中,實現視頻表征與機器人動作空間的協同優化;在對未來場景進行智能想象推演的同時,漸進式打磨動作生成的合理性與連貫性,使其在複雜長程任務規劃與執行中具備顯著優勢。
在全國多地人形機器人數據采集中心網絡的強大數據基建支撐下,優必選持續積累更多工業分揀、物料搬運、精細操作、雙臂協同等場景的高質量真實交互數據,為世界模型搭建紮實的物理世界認知基底。

所有真實數據均經過精細化清洗、多模態對齊與多層級質量篩選,留存高價值的場景交互、動作軌跡、環境動態變化樣本。這些數據有效地幫助世界模型深度學習真實物理規則、wutijiaohuluojiyugongyechangjingdongtaitezheng,jingzhunzhangwoxianshishijiedeshikongyanbianguilv,conggenyuanshangbimianxunishengchengdeshujutuolishijizuoyechangjingdewenti,weihouxuzhinengshujudeshengchengzhulaojianshigenji。
01、登頂Libero 攻克長程任務最難壁壘
Thinker-WM 憑借全新的多模態融合架構與自主智能進化能力,助力優必選在權威具身智能評測基準 Libero 中斬獲榜首。Libero 仿真環境重點評估機器人終身知識遷移能力,核心考核跨場景泛化、物體泛化、長程任務執行三大關鍵能力。
目前業內多數模型在空間泛化與物體泛化任務上已逼近滿分,但長程任務執行始終是行業長期難以攻克的技術壁壘。而 Thinker-WM 依托具身智能世界模型強大的場景推演與動態環境預判能力,有效破解了長程任務中的環境狀態時序變化、執(zhi)行(xing)誤(wu)差(cha)累(lei)積(ji)等(deng)核(he)心(xin)難(nan)題(ti),取(qu)得(de)當(dang)前(qian)長(chang)程(cheng)任(ren)務(wu)執(zhi)行(xing)最(zui)優(you)性(xing)能(neng)。同(tong)時(shi)我(wo)們(men)也(ye)清(qing)晰(xi)看(kan)到(dao),模(mo)型(xing)在(zai)空(kong)間(jian)泛(fan)化(hua)與(yu)物(wu)體(ti)泛(fan)化(hua)維(wei)度(du)仍(reng)有(you)性(xing)能(neng)提(ti)升(sheng)潛(qian)力(li),後(hou)續(xu)將(jiang)通(tong)過(guo)高(gao)質(zhi)量(liang)場(chang)景(jing)數(shu)據(ju)迭(die)代(dai)、模型底層架構持續優化,進一步補齊能力短板、實現綜合性能再躍升。

為進一步驗證Thinker-WM模型在更加真實的複雜場景下的動作生成精度與未來預測能力,針對日常家居與辦公兩大典型場景,我們在另一個權威Benchmark——Robotwin中選取了六大類精細化基礎操作任務構建評測集,對Thinker-WM的動作執行精度、軌跡穩定性及生成內容的視覺保真度(PSNR, SSIM)進行同步量化評估與多維分析,結果展現出Thinker-WM在更加複雜場景下的依然具有高精度的操作與視頻生成能力。
02、世界模型驅動智能數據飛輪 打造虛實協同的全新訓練範式
當前行業普遍存在真實機器人交互數據采集成本高、危險場景采樣難、長尾樣本數量稀缺、動態複雜任務數據不足等問題,單純依靠真機采集的傳統訓練方式,已經無法滿足機器人動態預判、精細操控與複雜場景適配的迭代需求。

優必選依托全新世界模型架構,重構具身數據的生產與訓練邏輯,搭建專屬新一代具身模型的AI數據飛輪體係,打破真實數據采集的物理限製,實現數據與模型的雙向協同進化。
真實數據打底 少量數據撬動超強泛化性能
少量高質量的真機數據能夠精準錨定真實世界的物理交互規則與作業約束,為模型提供不可替代的“地基”。

例li如ru,單dan條tiao操cao作zuo數shu據ju就jiu可ke以yi生sheng成cheng十shi條tiao以yi上shang相xiang同tong場chang景jing不bu同tong軌gui跡ji的de高gao保bao真zhen虛xu擬ni數shu據ju,極ji大da放fang大da有you限xian真zhen實shi樣yang本ben的de利li用yong效xiao率lv。這zhe套tao範fan式shi擺bai脫tuo了le行xing業ye對dui超chao大da批pi量liang真zhen實shi標biao注zhu數shu據ju集ji的de依yi賴lai,最zui終zhong實shi現xian更geng低di訓xun練lian成cheng本ben、更強動態預判、更穩精細操控、更廣場景泛化的工程落地優勢。
虛擬數據 擴容虛實融合補齊數據短板
區(qu)別(bie)於(yu)傳(chuan)統(tong)模(mo)型(xing)完(wan)全(quan)依(yi)賴(lai)真(zhen)實(shi)數(shu)據(ju)訓(xun)練(lian)的(de)局(ju)限(xian)性(xing),新(xin)一(yi)代(dai)模(mo)型(xing)可(ke)以(yi)依(yi)托(tuo)自(zi)主(zhu)習(xi)得(de)的(de)物(wu)理(li)世(shi)界(jie)規(gui)律(lv),釋(shi)放(fang)強(qiang)大(da)的(de)場(chang)景(jing)想(xiang)象(xiang)與(yu)智(zhi)能(neng)數(shu)據(ju)生(sheng)成(cheng)能(neng)力(li)。基(ji)於(yu)少(shao)量(liang)高(gao)質(zhi)量(liang)真(zhen)實(shi)基(ji)準(zhun)數(shu)據(ju),世(shi)界(jie)模(mo)型(xing)能(neng)夠(gou)智(zhi)能(neng)推(tui)演(yan)生(sheng)成(cheng)海(hai)量(liang)高(gao)保(bao)真(zhen)、多樣化、高難度的虛擬訓練數據,補齊真機難以采集的極限工況、動態幹擾、長尾場景、多步驟複雜操作等稀缺樣本。同時支持場景環境、光照視角、物體姿態、作業軌跡的自適應泛化生成,有效彌補真實數據集的場景短板,低成本訓練數據量級與多樣性的雙重提升。
雙向進化閉環 VLA與世界模型的雙向進化
升級後的具身智能數據采集鏈路包含了真實數據校準、世界模型生成、高質量數據回流、VLA策略優化,形成更加穩健端到端數據閉環飛輪。世界模型產出的海量高保真虛擬數據,可持續為下遊VLA模型提供訓練支撐,有效強化VLA的精細動作控製、動態場景響應、複雜任務閉環執行能力,補足傳統VLA模型訓練樣本單一、動態適配能力弱、小場景泛化效果差的短板。同時VLA在真實場景作業中產生的全新交互數據、失(shi)敗(bai)案(an)例(li)與(yu)實(shi)操(cao)反(fan)饋(kui),會(hui)反(fan)向(xiang)回(hui)流(liu)迭(die)代(dai)世(shi)界(jie)模(mo)型(xing),持(chi)續(xu)優(you)化(hua)模(mo)型(xing)的(de)物(wu)理(li)推(tui)演(yan)精(jing)度(du)與(yu)場(chang)景(jing)生(sheng)成(cheng)質(zhi)量(liang),讓(rang)虛(xu)擬(ni)數(shu)據(ju)更(geng)加(jia)貼(tie)合(he)真(zhen)實(shi)工(gong)業(ye)作(zuo)業(ye)邏(luo)輯(ji)。

03、數據飛輪驅動模型進化 加速通用具身智能落地
優必選Thinker-WM通過真實數據打底、虛擬數據擴容、雙shuang向xiang進jin化hua閉bi環huan的de模mo式shi,模mo型xing既ji可ke精jing準zhun掌zhang握wo真zhen實shi物wu理li規gui則ze,又you能neng依yi托tuo海hai量liang泛fan化hua樣yang本ben提ti升sheng複fu雜za場chang景jing適shi配pei能neng力li,實shi現xian從cong被bei動dong數shu據ju投tou喂wei到dao主zhu動dong生sheng成cheng數shu據ju、自主學習技能、持續優化能力的跨越式升級。這套自驅式數據迭代機製,使模型在持續場景交互與數據循環中補齊能力短板、拓展技能邊界。
堅持技術開源,優必選近期將在具身智能開發者社區Thinker-Cosmos上開源Thinker-WM,攜手全球開發者共建具身智能數據生態,持續推進模型迭代革新,加速人形機器人在千行百業的規模化落地與應用普及。