http://kadhoai.com.cn 2026-04-25 16:32:25 來源:Imagination Technologies
人工智能(AI)在邊緣計算領域正經曆著突飛猛進的高速發展,根據IDC的最新數據,全球邊緣計算支出將從2024年的2280億美元快速增長到2028年的3780億美元*。這種需求的增長速度,以及在智能製造、智zhi慧hui城cheng市shi等deng數shu十shi個ge行xing業ye中zhong越yue來lai越yue多duo的de應ying用yong場chang景jing中zhong出chu現xian的de滲shen透tou率lv快kuai速su提ti升sheng,也ye為wei執zhi行xing計ji算suan任ren務wu的de硬ying件jian設she計ji以yi及ji麵mian對dui多duo樣yang化hua場chang景jing的de模mo型xing迭die代dai的de速su度du帶dai來lai了le挑tiao戰zhan。
AI不僅是一項技術突破,它更是軟件編寫、理解和執行方式的一次永久性變革。傳統的軟件開發基於確定性邏輯和大多是順序執行的流程,而如今這一範式正在讓位於概率模型、訓練行為以及數據驅動的計算。這並不是一時的潮流。AI 代表了計算機科學的一次根本性、不可逆的轉變 —— 從基於規則的編程,邁向自適應的、基於學習的係統,這些係統正逐步被集成到越來越廣泛的計算問題與能力中。
這一轉變也對硬件提出了相應的變革需求。在AI架構和算法不斷演進(並將持續演進)的時代,為狹窄定義任務而打造的高度專用芯片的舊模式已不再適用。為了滿足不斷變化的AI需求(尤其是在邊緣側),我們需要具備與工作負載同樣動態、適應能力強的計算平台。
這正是通用並行處理器(即GPU)成為邊緣AI未來的關鍵所在,並開始取代專門的處理器,如神經網絡處理器(NPU)。這不僅僅是性能上的考量——它關乎靈活性、可擴展性,以及與未來軟件發展趨勢的同步。

Makimoto波動理論與“靈活性”的回歸
要理解這一轉變,我們隻需回顧“Makimoto波動理論”:這是由日本工程師牧本次雄(Tsugio Makimoto)提出的一個概念,描述了計算產業在不同階段不斷在“標準化”與“定製化”之間擺動的趨勢,其背後是市場需求、技術創新和軟件複雜性等因素的持續變化。
(Makimoto 波動理論展現了計算產業在“靈活性”與“專用性”之間的曆史擺動。而當前AI的發展軌跡,標誌著計算正再次呈現出在“靈活性”和“通用平台”之間的擺動。)
這一模型與AI硬件的演變過程高度契合。在AI發展的早期階段,工作負載較為明確且穩定,此時采用NPU等固定功能加速器是合理的。這類處理器對特定任務(例如使用CNN進行圖像分類或目標檢測)進行了深度優化。
但如今AI已進入高速演進階段。我們已走出簡單、靜態模型的時代,邁入混合網絡、Transformer架構、基礎模型和持續創新的浪潮之中。為去年AI打造的定製硬件,根本無法跟上當今的發展節奏。
正zheng如ru我wo們men在zai本ben文wen一yi開kai始shi所suo介jie紹shao的de那na樣yang,當dang一yi個ge行xing業ye不bu得de不bu去qu麵mian對dui超chao高gao的de增zeng長chang率lv,以yi及ji每mei天tian都dou在zai不bu斷duan出chu現xian的de新xin應ying用yong場chang景jing和he為wei此ci而er快kuai速su迭die代dai的de模mo型xing,使shi我wo們men再zai次ci站zhan在zai了le“Makimoto拐點”上 —— 從專用硬件,回歸到可擴展、可適配的通用計算平台。
AI是一個並行計算問題,而非專用計算問題
AI的本質在於並行計算。深度學習嚴重依賴並發操作 —— 矩陣運算、張量乘法、向量計算 —— 這些正是GPU天生擅長的工作負載。能夠同時渲染數百萬像素的架構,如今正好可以處理數百萬神經元的激活。
如今的通用GPU早已不僅僅用於圖形處理。它們擁有可編程管線、計算著色器,以及日益增強的AI中心化設計,不僅能加速傳統負載,也能支持新興的AI工作負載,是邊緣AI中強大而靈活的計算引擎。
相比之下,像NPU這樣的專用處理器則難以應對持續的變革。它們對特定操作進行了優化,而當AI領域快速演進時,這些芯片便迅速被淘汰。顯然,麵對這種全新的軟件範式,我們需要的是一種通用的、並行的、靈活的硬件平台 —— GPU。
為什麼通用平台在邊緣側更具優勢
邊緣AI不僅需要性能,更需要適應性、可重用性與較長的生命周期;隨著AI處(chu)理(li)器(qi)的(de)設(she)計(ji)越(yue)來(lai)越(yue)複(fu)雜(za),且(qie)隨(sui)著(zhe)市(shi)場(chang)規(gui)模(mo)的(de)擴(kuo)大(da)會(hui)吸(xi)引(yin)更(geng)多(duo)的(de)玩(wan)家(jia),大(da)家(jia)都(dou)爭(zheng)相(xiang)采(cai)用(yong)更(geng)先(xian)進(jin)的(de)工(gong)藝(yi)來(lai)實(shi)現(xian)性(xing)價(jia)比(bi)和(he)功(gong)耗(hao)的(de)優(you)化(hua),以(yi)及(ji)在(zai)生(sheng)態(tai)建(jian)設(she)方(fang)麵(mian)的(de)大(da)量(liang)花(hua)費(fei),使(shi)得(de)每(mei)個(ge)芯(xin)片(pian)項(xiang)目(mu)的(de)投(tou)入(ru)正(zheng)變(bian)得(de)越(yue)來(lai)越(yue)高(gao)。針(zhen)對(dui)這(zhe)些(xie)技(ji)術(shu)經(jing)濟(ji)學(xue)挑(tiao)戰(zhan),現(xian)代(dai)GPU等通用並行處理器在這幾個方麵均具備明顯優勢:
靈活性:可編程,能夠支持新的模型類型而無需更換硬件;
可擴展性:可適配從物聯網(IoT)傳感器到智能攝像頭再到自動駕駛汽車等各種邊緣設備;
軟件生態成熟:擁有豐富的開源工具與開發標準(如OpenCL、LiteRT和TVM);
可持續性:延長產品生命周期,減少不斷重新設計芯片的需求。
簡而言之,GPU的通用並行計算從架構層麵就為AI的持續演進而設計。而GPU領域內的本身創新也在快速驗證這一趨勢,例如Imagination在不久前發布的E係列GPU就具有突破性的高效並行處理架構,在提供卓越圖形性能的同時,針對人工智能工作負載,其 INT8/FP8 算力可在 2 到 200 TOPS 之間擴展。
展望未來
盡管有越來越多的證據說明GPU具備的優勢,市場仍然習慣將AI加速與NPU或定製芯片劃等號。但正如圖形行業早年發現,固定功能的圖形管線無法跟上遊戲創新的節奏;如今AI行業也發現:固定硬件無法匹配快速變化的軟件需求。
是時候重新教育整個生態了。邊緣AI的未來不屬於那些高度優化但功能狹窄的芯片,而是屬於可編程的、可適配的並行計算平台,它們能與智能軟件共同成長並擴展。諸如Imagination全新的E係列GPU,它為未來的邊緣應用提供了一種通用且可編程的解決方案,涵蓋圖形渲染、桌麵和智能手機等領域,可實現自然語言處理、工業計算機視覺以及自動駕駛等應用。
幾十年前,Makimoto就洞察了這一趨勢。如今,我們正在親身經曆他的遠見 —— 順應著通用性和靈活性的浪潮前行。GPU 不再是追趕者,它已處於領先位置。