http://kadhoai.com.cn 2026-04-25 04:13:13 來源:華興萬邦
隨著大模型在不斷演進的同時將推理應用大規模推向邊緣和端點設備,以及物聯網智化、具身智能、AI智能體(AI Agent)和物理AI等新的AI應用場景和模式的快速湧現,AI賦(fu)能(neng)設(she)備(bei)的(de)主(zhu)控(kong)芯(xin)片(pian)設(she)計(ji)師(shi)正(zheng)麵(mian)臨(lin)著(zhe)全(quan)新(xin)的(de)挑(tiao)戰(zhan)。尤(you)其(qi)是(shi)對(dui)於(yu)邊(bian)緣(yuan)和(he)端(duan)點(dian)設(she)備(bei),它(ta)們(men)既(ji)可(ke)能(neng)成(cheng)為(wei)大(da)模(mo)型(xing)的(de)承(cheng)載(zai)設(she)備(bei),也(ye)可(ke)能(neng)是(shi)用(yong)智(zhi)能(neng)去(qu)為(wei)應(ying)用(yong)提(ti)供(gong)更(geng)好(hao)的(de)核(he)心(xin)功(gong)能(neng),新(xin)的(de)產(chan)品(pin)定(ding)義(yi)方(fang)向(xiang)使(shi)主(zhu)芯(xin)片(pian)架(jia)構(gou)師(shi)不(bu)得(de)不(bu)去(qu)思(si)考(kao),其(qi)芯(xin)片(pian)在(zai)如(ru)何(he)應(ying)對(dui)大(da)模(mo)型(xing)快(kuai)速(su)演(yan)進(jin)的(de)同(tong)時(shi),還(hai)能(neng)實(shi)現(xian)用(yong)智(zhi)能(neng)手(shou)段(duan)賦(fu)能(neng)傳(chuan)統(tong)應(ying)用(yong)和(he)實(shi)現(xian)新(xin)興(xing)功(gong)能(neng)。
因此,在追求極致性能、功耗和麵積(PPA)的模式之外,架構師們需要富有前瞻性地去選擇高性能、高靈活性、可升級和開發者(生態)友好的架構。我們不妨先回顧AI發展的曆程,從感知AI到生成式AI,再到智能體AI和物理AI,其應用場景不斷拓展。在感知AI階段,Al技術在語音識別、深度推薦係統和醫學影像等領域取得顯著進展;生成式AI在數字營銷和內容創作方麵發揮了重要作用;智能體AI為編程、客戶服務、患者護理提供助力;物理AI推動了自動駕駛汽車和通用機器人發展。

伴隨著AI技術的發展,在傳統的CPU、GPU和FPGA等計算技術之外,諸如TPU、NPU 和DPU等專門針對特定算法或者模型的新型硬件數據處理加速器也開始出現,它們帶來高效率因而在許多場景中得到了應用。與此同時,AI技術不斷向新的場景和應用廣泛滲透,使得麵向特定模型和場景的NPU等架構難以應對模型的變化和場景的多樣化,從而使傳統的 靈活性更高的CPU和GPU架構依舊在計算領域占據重要地位。
但是,AI技術的進步和新場景的出現,正在迫使半導體知識產權(IP)提供商和芯片設計公司快速做出變化,無論是采用傳統架構的廠商,還是新的xPU提(ti)供(gong)商(shang)都(dou)需(xu)要(yao)尊(zun)重(zhong)產(chan)業(ye)規(gui)律(lv)。華(hua)興(xing)萬(wan)邦(bang)亦(yi)認(ren)為(wei),從(cong)技(ji)術(shu)經(jing)濟(ji)學(xue)和(he)企(qi)業(ye)實(shi)際(ji)經(jing)營(ying)來(lai)看(kan),高(gao)額(e)的(de)研(yan)發(fa)費(fei)用(yong)和(he)市(shi)場(chang)營(ying)銷(xiao)費(fei)用(yong)是(shi)多(duo)數(shu)芯(xin)片(pian)設(she)計(ji)企(qi)業(ye)麵(mian)臨(lin)的(de)最(zui)重(zhong)要(yao)費(fei)用(yong),而(er)靈(ling)活(huo)可(ke)擴(kuo)展(zhan)的(de)架(jia)構(gou)可(ke)以(yi)覆(fu)蓋(gai)更(geng)廣(guang)的(de)市(shi)場(chang)並(bing)可(ke)以(yi)實(shi)現(xian)更(geng)長(chang)的(de)產(chan)品(pin)生(sheng)命(ming)周(zhou)期(qi),它(ta)們(men)是(shi)攤(tan)銷(xiao)這(zhe)些(xie)費(fei)用(yong)以(yi)提(ti)升(sheng)盈(ying)利(li)能(neng)力(li)的(de)重(zhong)要(yao)手(shou)段(duan)。
架構創新迫在眉睫
Imagination Technologies中國業務發展負責人黃音在慕尼黑電子展AI技術創新論壇演講中分析道:“當前主芯片設計不僅需要芯片企業投入大量研發資源,更需要協調生態合作夥伴的技術路線。麵對AI算法快速迭代的挑戰,行業在探索創新架構的同時,仍需重視經過長期驗證的基礎計算架構價值。以GPU為例,其架構在保持高並行計算優勢的同時,新一代設計正通過模塊化擴展能力(如可配置Shader集群、彈性內存子係統)來適應不同AI工作負載需求。作為專注圖形計算領域的IP廠商,Imagination觀察到,理想的AI加速架構需要在三個維度取得平衡:支持細粒度並行的計算單元設計、滿足算法動態調整的可配置性,以及維持開發工具鏈的持續兼容性。”

“擴展能力是Imagination GPU開發演進的方向:在具備強大的渲染能力的同時,融合AI並行計算能力,在邊緣AI的場景下能提供靈活又高效的算力。所以,Imagination將幫助芯片設計人員發現真正的破局點,幫助他們去構建一個可以持續適配模型和算法演進、以及支持新興應用的架構平台——而不是為某個模型做一次性的‘專用硬件定製’,從而避免硬件(處理器)總是費力費錢跟著算法跑的問題。”黃音補充道。
Imagination正在幫助客戶導入更加靈活的架構。以該公司不久前發布的Imagination DXTP GPU IP為例,它采用了先進的平衡架構,增加了緩存和係統級帶寬,實現了更高的持續性能,幾何吞吐量提高50%,不僅能夠輕鬆同時處理圖形和計算任務,而且其功率效率還較其前序產品提升了20%,為邊緣AI提供了理想的GPU平台。DXTP GPU已經被全球知名科技公司采用,用於對AI 多數據類型處理、計算任務加速和本地內存的支持。

三個落地是成功的關鍵
當然,對於芯片設計師而言,這需要做到三個必須“落地”,即模型算法落地、垂直功能落地和開放生態落地。針對模型算法落地,Imagination的突破點是堅持構建一個通用可編程的並行架構平台,並通過開放的編譯器和推理後端(backend),支持客戶軟硬件協同設計和提供適配路徑,幫助其客戶把諸如Transformer、Diffusion類模型和前沿算法快速落地到GPU上。為此該公司將幫助客戶認識到在算法不斷演化的時代,架構的“適配力”遠比一時的TOPS值更重要。
在垂直功能落地方麵,Imagination在移動、汽車、yunhezhuomiandenglingyushengengleshushinian,jileilefengfudejingyanhexuduochuangxindezhichengxingjishu,keyibangzhukehuqubikaiqizhongdeqianzaifengxianhekuaisuzailingyuneichuangzaoyoushi,zhekeyiconggaigongsideD係列GPU IP的產品功能創新上可以看出其垂直領域功能落地能力。例如,DXT GPU 是Imagination麵向移動應用、高端遊戲和專業圖形設計等應用推出的新一代GPU IP,它不僅率先在移動平台上提供了可擴展的光線追蹤功能,還有2D雙速率紋理映射等多項可以提升處理速度和優化內存帶寬的技術。
為了幫助桌麵和數據中心客戶實現高性能的雲端GPU創新解決方案,Imagination推出了DXD GPU IP,首次將Imagination的API覆蓋擴展至DirectX,這一舉措顯著提升了DXD與Windows平台上的應用程序和遊戲的兼容性。同時,Imagination 的硬件虛擬化技術 HyperLane支持在單個GPUshanganquanqiedulidiyunxingduogecaozuoxitong,jidaditishenglefuwuqideshiyongxiaolv,jiangdileyunyouxideyunyingchengben,bingweiyunyouxixingyedefazhandailailechuangxindeyunyingmoshi。

Imagination為汽車智駕芯片提供的專用IP是該公司支持芯片設計企業垂直功能落地的又一個典範,血的教訓換來了更加嚴格的安全法規,使智駕芯片設計公司在算力、生態和生命周期之外,必須去認真去考慮功能安全性。為了幫助芯片設計企業滿足全球汽車智能化需求,Imagination推出了DXS係列GPU,該係列IP不僅為智能駕駛艙和先進駕駛輔助(ADAS)等應用所需SoC帶來匹配的算力,而且專為諸如汽車處理器等對功能安全性要求極為嚴苛的應用,開發了結合GPU的計算模式特點並大幅降低成本的分布式功能安全機製(DSM)並通過了ASIL-B認證。這為汽車和工業等越來越多需要GPU的圖形處理能力和計算能力的電子係統帶來了巨大的創新。
Imagination在支持客戶實現產業生態落地方麵也同樣頗費心機,其GPU IP全麵支持OpenCL、SYCL、Vulkan Compute等開放標準,與PyTorch、TensorFlow等主流框架完美兼容。如Imagination通過與安卓生態係統合作,優化對LiteRT的支持,為開發者提供豐富工具和示例,便於開發高性能AI應用,充分展現了其GPU架(jia)構(gou)的(de)適(shi)配(pei)能(neng)力(li)。這(zhe)種(zhong)開(kai)放(fang)生(sheng)態(tai)簡(jian)化(hua)了(le)新(xin)硬(ying)件(jian)與(yu)設(she)備(bei)的(de)集(ji)成(cheng)流(liu)程(cheng),避(bi)免(mian)供(gong)應(ying)商(shang)鎖(suo)定(ding)問(wen)題(ti),使(shi)客(ke)戶(hu)能(neng)在(zai)不(bu)同(tong)平(ping)台(tai)輕(qing)鬆(song)部(bu)署(shu)。通(tong)過(guo)整(zheng)合(he)多(duo)方(fang)資(zi)源(yuan),Imagination可幫助客戶實現協同優化,提升資源利用率和執行效率,鞏固了其在GPU市場的領先地位,為企業應對AI算法和產品快速迭代提供堅實支持。
總結與展望
大模型的下沉、算法創新和邊緣及端側AI的崛起為基於 GPU的主控芯片帶來了新的發展契機,在AI一體機、新物聯網、智能安防和自動駕駛等領域已經出現了巨大的需求,這些設備對高性能的圖形處理和AItuilitongshidouyouyuelaiyueduodexuqiu,yincigenglinghuohekekuozhandejiagoukeyishixinpianshejigongsidechanpinfugaigengguangfandeshichanglingyu,tongshikeyiyongyougengchangdechanpinshengmingzhouqi,yejiuyoulegenggaodeqianzaiyinglinengli。