http://kadhoai.com.cn 2026-04-26 17:08:20 來源:經濟日報
導讀:目前,機器視覺在工業電子以及半導體行業應用還是最為主要的,如PCB板缺陷檢測、IC芯片缺陷檢測等。交通領域的應用如電子眼也較為廣泛,其他行業如製藥中的藥品成分分析、互聯網中的視覺計算廣告、物流中的物品分揀等等,都有機器視覺應用的影子。機器視覺——這一“第三隻眼”正以巨大的能量,改變著人們的生活和工作方式。
想記錄眼前美景?不用再掏出相機或手機,隻需一句語音指令,佩戴的輕巧時尚的穀歌眼鏡就能立刻拍出眼前的圖景;走在陌生的大街上,不用再查地圖或問路,隻需將手機攝像頭對準街道,諾基亞“城市萬花筒”就能將眼前的商店、餐館和景點直接標注,覆蓋顯示在手機圖像上……這些以往多是在電影中看到的畫麵,已成為普通人可以觸摸到的現實。機器視覺——這一“第三隻眼”正以巨大的能量,改變著人們的生活和工作方式。記者就此專訪中國科學院自動化所專家,為讀者解密神奇的“第三隻眼”
與人眼一決高低
“機器視覺就是用機器代替人眼來進行識別、測量、判斷等。機器視覺係統是通過攝像頭將拍攝對象轉換成圖像信號,然後再交由圖像分析係統進行分析、測量等。”中國科學院自動化研究所模式識別國家重點實驗室研究員黃凱奇博士介紹:“機器視覺是一項典型的跨學科任務,涉及到光學、計算機視覺、模式識別、機器學習、人工智能、統計學、認知心理學等等。”

中國科學院自動化研究所黃凱奇研究員在展示監測機櫃
機ji器qi視shi覺jiao最zui早zao應ying用yong於yu工gong業ye製zhi造zao領ling域yu。通tong過guo機ji器qi視shi覺jiao的de自zi動dong識shi別bie功gong能neng,許xu多duo流liu水shui線xian上shang具ju有you高gao度du重zhong複fu性xing的de檢jian測ce工gong作zuo都dou可ke以yi不bu再zai依yi靠kao人ren來lai完wan成cheng,大da大da提ti高gao了le檢jian測ce效xiao率lv和he精jing度du。黃huang凱kai奇qi介jie紹shao,機ji器qi視shi覺jiao係xi統tong最zui基ji本ben的de特te點dian就jiu是shi提ti高gao生sheng產chan的de靈ling活huo性xing和he自zi動dong化hua程cheng度du。在zai一yi些xie不bu適shi於yu人ren工gong作zuo業ye的de危wei險xian工gong作zuo環huan境jing或huo者zhe人ren工gong視shi覺jiao難nan以yi滿man足zu要yao求qiu的de場chang合he,常chang用yong機ji器qi視shi覺jiao來lai替ti代dai人ren工gong視shi覺jiao。同tong時shi,在zai大da批pi量liang重zhong複fu性xing工gong業ye生sheng產chan過guo程cheng中zhong,用yong機ji器qi視shi覺jiao檢jian測ce方fang法fa可ke以yi大da大da提ti高gao生sheng產chan的de效xiao率lv和he自zi動dong化hua程cheng度du。
一個典型的機器視覺係統包括照明、鏡頭、相機、圖像采集卡和視覺處理器5gebufen。youyucaijikanenggengjiaxunsudichuanshutuxiangdaocunchuqi,qiejisuanjisudubuduanjiakuai,suoyizaimuqiandejiqishijiaoxitongzhong,shijiaochuliqideyingyongzhujianjianshao。tuxiangcaijikazaijiqishijiaoxitongzhongjuzuqingzhong。bijiaodianxingdePCI或AGP兼(jian)容(rong)的(de)捕(bu)獲(huo)卡(ka),可(ke)以(yi)將(jiang)圖(tu)像(xiang)迅(xun)速(su)地(di)傳(chuan)送(song)到(dao)計(ji)算(suan)機(ji)存(cun)儲(chu)器(qi)進(jin)行(xing)處(chu)理(li)。有(you)些(xie)采(cai)集(ji)卡(ka)有(you)內(nei)置(zhi)的(de)多(duo)路(lu)開(kai)關(guan),可(ke)連(lian)接(jie)多(duo)台(tai)相(xiang)機(ji),能(neng)控(kong)製(zhi)采(cai)集(ji)卡(ka)采(cai)用(yong)任(ren)意(yi)一(yi)個(ge)相(xiang)機(ji)捕(bu)獲(huo)的(de)信(xin)息(xi)。
伴隨著技術的發展,機器視覺的功能也在不斷擴展。黃凱奇說:“缺陷檢測是通過機器視覺手段來分析零部件信息,從而判斷其是否存在缺陷;測量是通過使用機器視覺來對考察對象的尺寸、形狀等信息進行度量;人機交互是利用機器視覺工具分析人或者其他機器發出的指令,從而實現對機器的操縱;環境建模是對機器周圍環境進行感知建模,比如移動機器人對路麵環境進行感知建模等。”
“目前總的看來,機器視覺在工業電子以及半導體行業應用還是最為主要的,如PCB板缺陷檢測、IC芯片缺陷檢測等。交通領域的應用如電子眼也較為廣泛,其他行業如製藥中的藥品成分分析、互聯網中的視覺計算廣告、物流中的物品分揀等等,都有機器視覺應用的影子。”黃凱奇說。
機器視覺——這“第三隻眼”已在多個領域展現出了比人眼更強大的功能。黃凱奇表示:“jiqishijiaoliyonghaolewanquankeyibirenzuodegenghao,yinweibutongderenzaiguankanshi,xinxidebudaochongfenhejishidejiaoliu,zhuguanxingyehenqiang。erjiqishijiaobujinjisuangongnengqiangda,erqiehuoqudexinxitongguoxietongfenxihoudedaodezhishihuijuyou‘極高’的價值,尤其在其更趨於智能化之後。”

中國科學院自動化研究所高偉副研究員在展示利用機器視覺技術生成的三維重建照片。
捕獲“深度”世界
在現實生活中,我們越來越需要更多的三維模型來實現對物體或環境的全麵掌握。“huodesanweimoxingyouliangzhongjibenfangshi,yizhongshiliyongjiguangsaomiaoyi,yizhongshipaishezhaopian。danjiguangsaomiaoyidechengbengao,yeyoukenenghuiduiyangbendailaiyixiesunhai。dierzhongfangshidechengbenxiao,erqiezaijingdushangyegenjiguangsaomiaoyixiangchawuji,yincichengweilexianzaiyanjiudeyigeredian。”中國科學院自動化研究所模式識別國家重點實驗室副研究員高偉博士一邊展示他們的三維重建照片,一邊介紹。
高偉說,一般的圖像上是沒有長度、距離等深度信息的,而三維模型則能更加全麵、精確地記錄環境,可以直觀呈現物體的位置、距離、zitaideng。gaoweisuozaidejiqirenshijiaotuanduiyanjiukaifadezhongguogudaijianzhuquanzidongsanweizhongjianxitong,nenggoushixianquanzidongsanweijianmo,jicongdicengtuxiangchulidaoshengchengzuizhongdesanweimoxing,quanbuzidongshixian,wuxurengongjiaohu。taduituxiangdepaishefangshiyewuteshuyueshuhexianzhi,zhixushouchiziyoupaishejike。zaijingdushang,yeyujiguangsaomiaojingduxiangdang,jingduxiaoyu3cm/100米,通過配備更高像素數量的相機和長焦鏡頭還可以實現毫米級重建。
ciwai,zaishishidingweiyuzaixiansanweizhongjianfangmian,jiqishijiaoyejuyoujidadeyingyongqianli。gaoweijieshaoletongguojiqishijiaozaishoujishangzengqiangxianshideyuanli,jijiangshoujishangshexiangtouduqudeshipinzuoweishuru,tongguochushihua、特征點提取、動態模板特征點匹配、幾何變化計算階段後得到視頻每一幀中感興趣區域的位置。諾基亞手機的“城市萬花筒”就是一個應用實例。
高偉所在團隊在視覺信息處理上的突出創新能力,不斷吸引著國際大企業前來合作。“我wo們men現xian在zai就jiu正zheng與yu諾nuo基ji亞ya公gong司si進jin行xing合he作zuo,共gong同tong研yan究jiu實shi時shi定ding位wei和he在zai線xian三san維wei重zhong建jian。目mu前qian,我wo國guo基ji於yu機ji器qi視shi覺jiao的de三san維wei重zhong建jian技ji術shu在zai國guo際ji上shang可ke以yi說shuo處chu於yu領ling先xian地di位wei,應ying用yong也ye是shi比bi較jiao廣guang泛fan的de。”高偉說:“除chu了le以yi上shang介jie紹shao的de,還hai能neng用yong在zai一yi些xie不bu太tai適shi合he人ren工gong作zuo業ye的de環huan境jing監jian測ce方fang麵mian,像xiang對dui露lu天tian煤mei礦kuang的de監jian測ce,就jiu是shi通tong過guo無wu人ren機ji對dui煤mei礦kuang進jin行xing全quan方fang位wei拍pai攝she,生sheng成cheng三san維wei模mo型xing來lai實shi時shi監jian測ce礦kuang山shan的de變bian化hua。此ci外wai,也ye能neng應ying用yong於yu城cheng市shi規gui劃hua、數字媒體、三維試衣、牙模製造等多方麵。”
由於單純依靠圖像信息很難實現快速、choumidesanweizhongjian,gaoweisuozaituanduiyezaishenruyanjiujiangduozhongchuanganqixinxixianghuronghejinxingsanweizhongjiandefangfa。muqian,tamenyikaifachuleliyongdanmushijiaotongbudingweiyudituchuangjianjishuyijiweiruangongsideKinect設備(微軟公司開發的應用於Xbox360主機的周邊外設,集成一個彩色攝影機、一個紅外攝像機和一個紅外投影機)的全自動場景快速重建係統。這一係統對單幀視頻圖像的處理時間小於50毫秒,可重建出稠密的三維點雲,能廣泛應用於多種室內場景,使用者可以隨意自由拍攝。
互動“大數據”時代
在備受關注的美國政府公布的“大數據研發計劃” (Big Data Research and Development Initiative)中包含一個旨在為機器建立視覺智能的Mind's Eye 項目。該計劃稱,傳統的機器視覺研究的對象選取廣泛的物體來描述一個場景的屬性名詞,而Mind's Eye旨在增加在這些場景的動作認識和推理需要的知覺認知基礎。總之,這些技術可以建立一個更完整的視覺智能效果。
由此可見,走在信息科技前沿的美國已對機器視覺與大數據時代的互動關係先知先覺。黃凱奇指出:“大數據時代最樸素也是最深刻的特點就是‘大’。統(tong)計(ji)學(xue)中(zhong)的(de)大(da)數(shu)定(ding)律(lv)指(zhi)出(chu),當(dang)隨(sui)機(ji)事(shi)件(jian)或(huo)者(zhe)試(shi)驗(yan)在(zai)大(da)量(liang)重(zhong)複(fu)出(chu)現(xian)的(de)條(tiao)件(jian)下(xia),往(wang)往(wang)呈(cheng)現(xian)幾(ji)乎(hu)必(bi)然(ran)的(de)統(tong)計(ji)特(te)性(xing)。確(que)切(qie)地(di)說(shuo),大(da)數(shu)定(ding)律(lv)是(shi)以(yi)確(que)切(qie)的(de)數(shu)學(xue)形(xing)式(shi)表(biao)達(da)了(le)大(da)量(liang)重(zhong)複(fu)出(chu)現(xian)的(de)隨(sui)機(ji)現(xian)象(xiang)的(de)統(tong)計(ji)規(gui)律(lv)性(xing)。對(dui)於(yu)依(yi)賴(lai)數(shu)據(ju)規(gui)律(lv)的(de)機(ji)器(qi)視(shi)覺(jiao)算(suan)法(fa)來(lai)講(jiang),大(da)數(shu)據(ju)無(wu)疑(yi)為(wei)人(ren)們(men)進(jin)一(yi)步(bu)發(fa)現(xian)人(ren)類(lei)的(de)認(ren)知(zhi)機(ji)理(li),實(shi)現(xian)更(geng)加(jia)魯(lu)棒(bang)[魯棒是Robust的音譯,也就是健壯、強壯、堅定、粗野的意思。魯棒性(robustness)就是係統的健壯性]的機器視覺算法提供了可能。另一方麵,隨著機器視覺係統更加魯棒穩定,更加智能,它在收集、分析、處chu理li海hai量liang信xin息xi方fang麵mian也ye將jiang發fa揮hui更geng加jia重zhong要yao的de作zuo用yong。簡jian言yan之zhi,機ji器qi視shi覺jiao一yi邊bian借jie大da數shu據ju之zhi利li不bu斷duan發fa展zhan,一yi邊bian又you靠kao技ji術shu的de完wan善shan而er反fan哺bu大da數shu據ju時shi代dai,形xing成cheng一yi個ge良liang性xing的de互hu動dong。”
然而,這種互動要想真正建立,還需要加強技術和產業的雙輪驅動。“國外在上世紀80年代就已出現大量的機器視覺產品,而我國機器視覺技術的應用始於90年代末。雖然在過去10年nian有you了le長chang足zu的de發fa展zhan,但dan目mu前qian絕jue大da部bu分fen還hai處chu於yu追zhui趕gan狀zhuang態tai,一yi個ge是shi技ji術shu上shang的de積ji累lei與yu創chuang新xin跟gen國guo外wai相xiang比bi還hai存cun在zai較jiao大da差cha距ju。另ling外wai一yi個ge是shi國guo內nei在zai應ying用yong創chuang新xin上shang也ye存cun在zai不bu足zu,很hen多duo都dou是shi跟gen隨sui國guo外wai的de應ying用yong案an例li或huo者zhe通tong過guo代dai理li相xiang關guan產chan品pin來lai實shi現xian模mo仿fang應ying用yong等deng。”黃凱奇表示。
目(mu)前(qian),機(ji)器(qi)視(shi)覺(jiao)在(zai)交(jiao)通(tong)等(deng)多(duo)個(ge)領(ling)域(yu)的(de)應(ying)用(yong)仍(reng)相(xiang)對(dui)單(dan)一(yi),存(cun)在(zai)著(zhe)多(duo)層(ceng)麵(mian)阻(zu)礙(ai)其(qi)進(jin)一(yi)步(bu)產(chan)業(ye)化(hua)發(fa)展(zhan)的(de)因(yin)素(su)。黃(huang)凱(kai)奇(qi)分(fen)析(xi)說(shuo),首(shou)先(xian)在(zai)魯(lu)棒(bang)穩(wen)定(ding)的(de)機(ji)器(qi)視(shi)覺(jiao)係(xi)統(tong)方(fang)麵(mian),因(yin)為(wei)機(ji)器(qi)視(shi)覺(jiao)技(ji)術(shu)涉(she)及(ji)眾(zhong)多(duo)學(xue)科(ke),需(xu)要(yao)不(bu)同(tong)學(xue)科(ke)協(xie)同(tong)創(chuang)新(xin)才(cai)能(neng)突(tu)破(po)目(mu)前(qian)發(fa)展(zhan)的(de)技(ji)術(shu)瓶(ping)頸(jing)。再(zai)一(yi)個(ge)就(jiu)是(shi)標(biao)準(zhun)方(fang)麵(mian),目(mu)前(qian)大(da)部(bu)分(fen)廠(chang)家(jia)為(wei)了(le)自(zi)身(shen)的(de)短(duan)期(qi)局(ju)部(bu)利(li)益(yi)都(dou)各(ge)自(zi)開(kai)發(fa)封(feng)閉(bi)的(de)設(she)備(bei)、協議、係統,這對整個行業的發展極為不利。“如何破除這種封閉狀態的弊端,製定行業統一開放標準是促進機器視覺行業形成大格局、大產業的必經之路。”黃凱奇說。
“haiyouyidianyuanyin,jiushiguanyujiqishijiaogangxudechuangzao。woguoshiyigedianxingdelaodonglimijiguojia,dabufenxingyeyikaodeshidiliandedaliangfuyulaodongli。erjiqishijiaoyuzidonghuaxixixiangguan,yinciruheyifangmianyouxiaojiejuejiuyewenti,lingyifangmianyougaoxiaotuijinjiqishijiaoxiangguanzidonghuachanpinshebeidetuiguangshiyong,shizhengfubumen、企業需要麵對的問題。”黃凱奇表示。