http://www.kadhoai.com.cn 2026-05-06 13:55:31 來源:優必選科技
隨著具身智能技術持續迭代,人形機器人的場景認知、zhilinglijieyurenwuguihuanengliwenbutisheng,zhubujubeizaizhenshigongyechangjingluodiyingyongdejichunengli。danzaidongtaiduobiandechanxianshicaohuanjingzhong,xingyetongyongdechuantongjushenfanganrengcunzaimingxianduanban:多duo數shu模mo型xing隻zhi能neng基ji於yu實shi時shi場chang景jing完wan成cheng靜jing態tai決jue策ce與yu短duan程cheng任ren務wu拆chai解jie,缺que少shao對dui物wu理li世shi界jie的de場chang景jing推tui演yan與yu未wei來lai狀zhuang態tai預yu判pan能neng力li,難nan以yi適shi配pei真zhen實shi工gong業ye場chang景jing實shi時shi變bian化hua的de長chang程cheng任ren務wu作zuo業ye需xu求qiu,導dao致zhi實shi現xian決jue策ce執zhi行xing與yu迭die代dai優you化hua的de全quan鏈lian路lu無wu法fa閉bi環huan。

優必選立足工業場景真實作業需求與具身智能技術演進方向,基於自研具身智能大模型Thinker,重磅推出全新具身智能世界模型Thinker-WM,打造物理AI基座,實現具身大腦架構與核心能力的全方位升級。憑借在空間泛化、長程任務和綜合性能上的優勢,Thinker-WM在權威具身智能評測基準 Libero 中登頂榜首。同時參與榜單排名的還有英偉達、Physical Intelligence、小米等知名公司的模型。
依托優必選在行業積累的數據及對模型架構的針對性優化,Thinker-WM構建了Diffusion Transformer統一多模態空間架構。模型在 Flow Matching 迭代演化過程中,實現視頻表征與機器人動作空間的協同優化;在對未來場景進行智能想象推演的同時,漸進式打磨動作生成的合理性與連貫性,使其在複雜長程任務規劃與執行中具備顯著優勢。
在全國多地人形機器人數據采集中心網絡的強大數據基建支撐下,優必選持續積累更多工業分揀、物料搬運、精細操作、雙臂協同等場景的高質量真實交互數據,為世界模型搭建紮實的物理世界認知基底。

所有真實數據均經過精細化清洗、多模態對齊與多層級質量篩選,留存高價值的場景交互、動作軌跡、環境動態變化樣本。這些數據有效地幫助世界模型深度學習真實物理規則、物(wu)體(ti)交(jiao)互(hu)邏(luo)輯(ji)與(yu)工(gong)業(ye)場(chang)景(jing)動(dong)態(tai)特(te)征(zheng),精(jing)準(zhun)掌(zhang)握(wo)現(xian)實(shi)世(shi)界(jie)的(de)時(shi)空(kong)演(yan)變(bian)規(gui)律(lv),從(cong)根(gen)源(yuan)上(shang)避(bi)免(mian)虛(xu)擬(ni)生(sheng)成(cheng)的(de)數(shu)據(ju)脫(tuo)離(li)實(shi)際(ji)作(zuo)業(ye)場(chang)景(jing)的(de)問(wen)題(ti),為(wei)後(hou)續(xu)智(zhi)能(neng)數(shu)據(ju)的(de)生(sheng)成(cheng)築(zhu)牢(lao)堅(jian)實(shi)根(gen)基(ji)。
01、登頂Libero 攻克長程任務最難壁壘
Thinker-WM 憑借全新的多模態融合架構與自主智能進化能力,助力優必選在權威具身智能評測基準 Libero 中斬獲榜首。Libero 仿真環境重點評估機器人終身知識遷移能力,核心考核跨場景泛化、物體泛化、長程任務執行三大關鍵能力。
目前業內多數模型在空間泛化與物體泛化任務上已逼近滿分,但長程任務執行始終是行業長期難以攻克的技術壁壘。而 Thinker-WM 依托具身智能世界模型強大的場景推演與動態環境預判能力,有效破解了長程任務中的環境狀態時序變化、zhixingwuchaleijidenghexinnanti,qudedangqianchangchengrenwuzhixingzuiyouxingneng。tongshiwomenyeqingxikandao,moxingzaikongjianfanhuayuwutifanhuaweidurengyouxingnengtishengqianli,houxujiangtongguogaozhiliangchangjingshujudiedai、模型底層架構持續優化,進一步補齊能力短板、實現綜合性能再躍升。

為進一步驗證Thinker-WM模型在更加真實的複雜場景下的動作生成精度與未來預測能力,針對日常家居與辦公兩大典型場景,我們在另一個權威Benchmark——Robotwin中選取了六大類精細化基礎操作任務構建評測集,對Thinker-WM的動作執行精度、軌跡穩定性及生成內容的視覺保真度(PSNR, SSIM)進行同步量化評估與多維分析,結果展現出Thinker-WM在更加複雜場景下的依然具有高精度的操作與視頻生成能力。
02、世界模型驅動智能數據飛輪 打造虛實協同的全新訓練範式
當前行業普遍存在真實機器人交互數據采集成本高、危險場景采樣難、長尾樣本數量稀缺、動態複雜任務數據不足等問題,單純依靠真機采集的傳統訓練方式,已經無法滿足機器人動態預判、精細操控與複雜場景適配的迭代需求。

優必選依托全新世界模型架構,重構具身數據的生產與訓練邏輯,搭建專屬新一代具身模型的AI數據飛輪體係,打破真實數據采集的物理限製,實現數據與模型的雙向協同進化。
真實數據打底 少量數據撬動超強泛化性能
少量高質量的真機數據能夠精準錨定真實世界的物理交互規則與作業約束,為模型提供不可替代的“地基”。

liru,dantiaocaozuoshujujiukeyishengchengshitiaoyishangxiangtongchangjingbutongguijidegaobaozhenxunishuju,jidafangdayouxianzhenshiyangbendeliyongxiaolv。zhetaofanshibaituolexingyeduichaodapiliangzhenshibiaozhushujujideyilai,zuizhongshixiangengdixunlianchengben、更強動態預判、更穩精細操控、更廣場景泛化的工程落地優勢。
虛擬數據 擴容虛實融合補齊數據短板
區(qu)別(bie)於(yu)傳(chuan)統(tong)模(mo)型(xing)完(wan)全(quan)依(yi)賴(lai)真(zhen)實(shi)數(shu)據(ju)訓(xun)練(lian)的(de)局(ju)限(xian)性(xing),新(xin)一(yi)代(dai)模(mo)型(xing)可(ke)以(yi)依(yi)托(tuo)自(zi)主(zhu)習(xi)得(de)的(de)物(wu)理(li)世(shi)界(jie)規(gui)律(lv),釋(shi)放(fang)強(qiang)大(da)的(de)場(chang)景(jing)想(xiang)象(xiang)與(yu)智(zhi)能(neng)數(shu)據(ju)生(sheng)成(cheng)能(neng)力(li)。基(ji)於(yu)少(shao)量(liang)高(gao)質(zhi)量(liang)真(zhen)實(shi)基(ji)準(zhun)數(shu)據(ju),世(shi)界(jie)模(mo)型(xing)能(neng)夠(gou)智(zhi)能(neng)推(tui)演(yan)生(sheng)成(cheng)海(hai)量(liang)高(gao)保(bao)真(zhen)、多樣化、高難度的虛擬訓練數據,補齊真機難以采集的極限工況、動態幹擾、長尾場景、多步驟複雜操作等稀缺樣本。同時支持場景環境、光照視角、物體姿態、作業軌跡的自適應泛化生成,有效彌補真實數據集的場景短板,低成本訓練數據量級與多樣性的雙重提升。
雙向進化閉環 VLA與世界模型的雙向進化
升級後的具身智能數據采集鏈路包含了真實數據校準、世界模型生成、高質量數據回流、VLA策略優化,形成更加穩健端到端數據閉環飛輪。世界模型產出的海量高保真虛擬數據,可持續為下遊VLA模型提供訓練支撐,有效強化VLA的精細動作控製、動態場景響應、複雜任務閉環執行能力,補足傳統VLA模型訓練樣本單一、動態適配能力弱、小場景泛化效果差的短板。同時VLA在真實場景作業中產生的全新交互數據、shibaianliyushicaofankui,huifanxianghuiliudiedaishijiemoxing,chixuyouhuamoxingdewulituiyanjingduyuchangjingshengchengzhiliang,rangxunishujugengjiatiehezhenshigongyezuoyeluoji。

03、數據飛輪驅動模型進化 加速通用具身智能落地
優必選Thinker-WM通過真實數據打底、虛擬數據擴容、雙(shuang)向(xiang)進(jin)化(hua)閉(bi)環(huan)的(de)模(mo)式(shi),模(mo)型(xing)既(ji)可(ke)精(jing)準(zhun)掌(zhang)握(wo)真(zhen)實(shi)物(wu)理(li)規(gui)則(ze),又(you)能(neng)依(yi)托(tuo)海(hai)量(liang)泛(fan)化(hua)樣(yang)本(ben)提(ti)升(sheng)複(fu)雜(za)場(chang)景(jing)適(shi)配(pei)能(neng)力(li),實(shi)現(xian)從(cong)被(bei)動(dong)數(shu)據(ju)投(tou)喂(wei)到(dao)主(zhu)動(dong)生(sheng)成(cheng)數(shu)據(ju)、自主學習技能、持續優化能力的跨越式升級。這套自驅式數據迭代機製,使模型在持續場景交互與數據循環中補齊能力短板、拓展技能邊界。
堅持技術開源,優必選近期將在具身智能開發者社區Thinker-Cosmos上開源Thinker-WM,攜手全球開發者共建具身智能數據生態,持續推進模型迭代革新,加速人形機器人在千行百業的規模化落地與應用普及。