http://kadhoai.com.cn 2026-04-26 18:41:59 來源:中國自動化學會專家谘詢工作委員會
根據有關學者的研究,數據密集型科學將成為繼實驗科學、理論科學、jisuanjikexuezhihou,renleikexueyanjiudedisigefanshi。yidashujuweidaibiaodeshujumijixingkexuejiangchengweixinyicijishubiangedejishi。suizheshujudejinyibujizhongheshujuliangdezengda,duihailiangshujujinxinganquanfanghubiandegengjiakunnan,shujudefenbushichuliyejiadaleshujuxieludefengxian,xinxianquanzhengchengweizhiyuedashujujishufazhandepingjing。
大數據時代已經到來
物聯網、雲計算、移動互聯網等新技術的發展,使得手機、平板電腦、PC及遍布地球各個角落的傳感器,成為數據來源和承載方式。據估計,互聯網上的數據量每兩年會翻一番,到2013年,互聯網上的數據量將達到每年667EB(1EB=230GB)。這些數據絕大多數是“非結構化數據”,通常不能為傳統的數據庫所用,但這些龐大的數據“寶藏”將成為“未來的新石油”。
1.大數據具有四個典型特征
大數據(Big Data)是指“無法用現有的軟件工具提取、存儲、搜索、共享、分析和處理的海量的、複雜的數據集合”。業界通常用四個V來概括大數據的特征。
——數據體量巨大(Volume)。到目前為止,人類生產的所有印刷材料的數據量是200PB(1PB=210TB),而曆史上全人類說過的所有的話的數據量大約5EB(1EB=210PB)。當前,典型個人計算機硬盤的容量為TB量級,而一些大企業的數據量已經接近EB量級。
——數據類型繁多(Variety)。zhezhongleixingdeduoyangxingyerangshujubeifenweijiegouhuashujuhefeijiegouhuashuju。xiangduiyuyiwangbianyucunchudeyiwenbenweizhudejiegouhuashuju,feijiegouhuashujuyuelaiyueduo,baokuowangluorizhi、音頻、視頻、圖片、地理位置信息等,這些多類型的數據對數據的處理能力提出了更高要求。
——價值密度低(Value)。價值密度的高低與數據總量的大小成反比。以視頻為例,一部1小時的視頻,在連續不間斷的監控中,有用數據可能僅有一兩秒。如何通過強大的機器算法更迅速地完成數據的價值“提純”,成為目前大數據背景下亟待解決的難題。
——處理速度快(Velocity)。這是大數據區分於傳統數據挖掘的最顯著特征。根據IDC的“數字宇宙”報告,預計到2020年,全球數據使用量將達到35.2ZB(1ZB=210EB)。在如此海量的數據麵前,處理數據的效率就是企業的生命。
2.大數據成為國家和企業的核心資產
2012年瑞士達沃斯論壇上發布的《大數據大影響》報告稱,數據已成為一種新的經濟資產類別,就像貨幣或黃金一樣。奧巴馬政府已把“大數據”上升到國家戰略層麵,2012年3月,美國宣布投資2億美元啟動“大數據研究和發展計劃”,借以增強收集海量數據、分析萃取信息的能力。美國政府認為,大數據是“未來的新石油”,一個國家擁有數據的規模、活性及解釋運用的能力將成為綜合國力的重要組成部分,未來對數據的占有和控製甚至將成為繼陸權、海權、空權之外國家的另一個核心資產。
duiqiyelaishuo,shujuzhengzaiqudairencaichengweiqiyedehexinjingzhengli。zaidashujushidai,shujuzichanqudairencaichengweiqiyezhishangzuizhongyaodezaiti。zhexienenggoubeiqiyesuishihuoqudeshuju,keyibangzhuhezhidaoqiyeduiquanyewuliuchengjinxingyouxiaoyunyingheyouhua,bangzhuqiyezuochuzuimingzhidejuece。cishi,qiyezhishangdejichujiushixingxingsesedeshuju。
大(da)數(shu)據(ju)在(zai)重(zhong)新(xin)定(ding)義(yi)企(qi)業(ye)智(zhi)商(shang)的(de)同(tong)時(shi),對(dui)企(qi)業(ye)核(he)心(xin)資(zi)產(chan)也(ye)進(jin)行(xing)了(le)重(zhong)塑(su),數(shu)據(ju)資(zi)產(chan)當(dang)仁(ren)不(bu)讓(rang)地(di)成(cheng)為(wei)現(xian)代(dai)商(shang)業(ye)社(she)會(hui)的(de)核(he)心(xin)競(jing)爭(zheng)力(li)。在(zai)大(da)數(shu)據(ju)時(shi)代(dai),企(qi)業(ye)必(bi)須(xu)熟(shu)悉(xi)和(he)用(yong)好(hao)海(hai)量(liang)的(de)數(shu)據(ju),而(er)互(hu)聯(lian)網(wang)行(xing)業(ye)已(yi)提(ti)早(zao)感(gan)受(shou)到(dao)了(le)大(da)數(shu)據(ju)帶(dai)來(lai)的(de)深(shen)切(qie)變(bian)化(hua)。一(yi)些(xie)互(hu)聯(lian)網(wang)企(qi)業(ye)已(yi)經(jing)完(wan)成(cheng)了(le)核(he)心(xin)競(jing)爭(zheng)力(li)的(de)重(zhong)新(xin)定(ding)義(yi)。
3.大數據“藍海”成為競爭的新焦點
大數據所能帶來的巨大商業價值,被認為將引領一場足以與20世紀計算機革命匹敵的巨大變革。大數據正在對每個領域造成影響,在商業、經(jing)濟(ji)和(he)其(qi)他(ta)領(ling)域(yu)中(zhong),決(jue)策(ce)行(xing)為(wei)將(jiang)日(ri)益(yi)基(ji)於(yu)數(shu)據(ju)分(fen)析(xi),而(er)不(bu)再(zai)是(shi)憑(ping)借(jie)經(jing)驗(yan)和(he)直(zhi)覺(jiao)。大(da)數(shu)據(ju)正(zheng)在(zai)成(cheng)為(wei)政(zheng)府(fu)和(he)企(qi)業(ye)競(jing)爭(zheng)的(de)新(xin)焦(jiao)點(dian)。各(ge)大(da)企(qi)業(ye)正(zheng)紛(fen)紛(fen)投(tou)向(xiang)大(da)數(shu)據(ju)促(cu)生(sheng)的(de)新(xin)藍(lan)海(hai)。甲(jia)骨(gu)文(wen)、IBM、微軟和SAP共投入超過15億美元成立各自的軟件智能數據管理和分析專業公司。在大數據時代,商業生態環境在不經意間發生了巨大變化:無處不在的智能終端、隨時在線的網絡傳輸、互hu動dong頻pin繁fan的de社she交jiao網wang絡luo,讓rang以yi往wang隻zhi是shi網wang頁ye瀏liu覽lan者zhe的de網wang民min的de麵mian孔kong從cong模mo糊hu變bian得de清qing晰xi,企qi業ye也ye有you機ji會hui進jin行xing大da規gui模mo的de精jing準zhun化hua的de消xiao費fei者zhe行xing為wei研yan究jiu。大da數shu據ju藍lan海hai將jiang成cheng為wei未wei來lai競jing爭zheng的de製zhi高gao點dian。
大數據給信息安全帶來了新的挑戰與機遇
大數據在成為競爭新焦點的同時,不僅帶來了更多安全風險,同時也帶來了新機遇。
一是大數據成為網絡攻擊的顯著目標。在網絡空間,大數據是更容易被“發現”的大目標。一方麵,大數據意味著海量的數據,也意味著更複雜、更geng敏min感gan的de數shu據ju,這zhe些xie數shu據ju會hui吸xi引yin更geng多duo的de潛qian在zai攻gong擊ji者zhe。另ling一yi方fang麵mian,數shu據ju的de大da量liang彙hui集ji,使shi得de黑hei客ke成cheng功gong攻gong擊ji一yi次ci就jiu能neng獲huo得de更geng多duo數shu據ju,無wu形xing中zhong降jiang低di了le黑hei客ke的de進jin攻gong成cheng本ben,增zeng加jia了le“收益率”。
二是大數據加大隱私泄露風險。大量數據的彙集不可避免地加大了用戶隱私泄露的風險。一方麵,數據集中存儲增加了泄露風險;而這些數據不被濫用,也成為人身安全的一部分;另一方麵,一些敏感數據的所有權和使用權並沒有明確界定,很多基於大數據的分析都未考慮到其中涉及的個體隱私問題。
sanshidashujuweixiexianyoudecunchuheanfangcuoshi。dashujucunchudailaixindeanquanwenti。shujudajizhongdehouguoshifuzaduoyangdeshujucunchuzaiyiqi,henkenenghuichuxianjiangmouxieshengchanshujufangzaijingyingshujucunchuweizhideqingkuang,zhishiqiyeanquanguanlibuhegui。dashujudedaxiaoyeyingxiangdaoanquankongzhicuoshinengfouzhengqueyunxing。anquanfanghushouduandegengxinshengjisuduwufagenshangshujuliangfeixianxingzengchangdebufa,jiuhuibaoludashujuanquanfanghudeloudong。
四si是shi大da數shu據ju技ji術shu成cheng為wei黑hei客ke的de攻gong擊ji手shou段duan。在zai企qi業ye用yong數shu據ju挖wa掘jue和he數shu據ju分fen析xi等deng大da數shu據ju技ji術shu獲huo取qu商shang業ye價jia值zhi的de同tong時shi,黑hei客ke也ye在zai利li用yong這zhe些xie大da數shu據ju技ji術shu向xiang企qi業ye發fa起qi攻gong擊ji。黑hei客ke會hui最zui大da限xian度du地di收shou集ji更geng多duo有you用yong信xin息xi,比bi如ru社she交jiao網wang絡luo、郵件、微博、電子商務、dianhuahejiatingzhuzhidengxinxi,dashujufenxishiheikedegongjigengjiajingzhun。ciwai,dashujuyeweiheikefaqigongjitigonglegengduojihui。heikeliyongdashujufaqijiangshiwangluogongji,kenenghuitongshikongzhishangbaiwantaikuileijibingfaqigongji。
五是大數據成為高級可持續攻擊的載體。傳統的檢測是基於單個時間點進行的基於威脅特征的實時匹配檢測,而高級可持續攻擊(APT)是shi一yi個ge實shi施shi過guo程cheng,無wu法fa被bei實shi時shi檢jian測ce。此ci外wai,大da數shu據ju的de價jia值zhi低di密mi度du性xing,使shi得de安an全quan分fen析xi工gong具ju很hen難nan聚ju焦jiao在zai價jia值zhi點dian上shang,黑hei客ke可ke以yi將jiang攻gong擊ji隱yin藏zang在zai大da數shu據ju中zhong,給gei安an全quan服fu務wu提ti供gong商shang的de分fen析xi製zhi造zao很hen大da困kun難nan。黑hei客ke設she置zhi的de任ren何he一yi個ge會hui誤wu導dao安an全quan廠chang商shang目mu標biao信xin息xi提ti取qu和he檢jian索suo的de攻gong擊ji,都dou會hui導dao致zhi安an全quan監jian測ce偏pian離li應ying有you方fang向xiang。
六liu是shi大da數shu據ju技ji術shu為wei信xin息xi安an全quan提ti供gong新xin支zhi撐cheng。當dang然ran,大da數shu據ju也ye為wei信xin息xi安an全quan的de發fa展zhan提ti供gong了le新xin機ji遇yu。大da數shu據ju正zheng在zai為wei安an全quan分fen析xi提ti供gong新xin的de可ke能neng性xing,對dui於yu海hai量liang數shu據ju的de分fen析xi有you助zhu於yu信xin息xi安an全quan服fu務wu提ti供gong商shang更geng好hao地di刻ke畫hua網wang絡luo異yi常chang行xing為wei,從cong而er找zhao出chu數shu據ju中zhong的de風feng險xian點dian。對dui實shi時shi安an全quan和he商shang務wu數shu據ju結jie合he在zai一yi起qi的de數shu據ju進jin行xing預yu防fang性xing分fen析xi,可ke識shi別bie釣diao魚yu攻gong擊ji,防fang止zhi詐zha騙pian和he阻zu止zhi黑hei客ke入ru侵qin。網wang絡luo攻gong擊ji行xing為wei總zong會hui留liu下xia蛛zhu絲si馬ma跡ji,這zhe些xie痕hen跡ji都dou以yi數shu據ju的de形xing式shi隱yin藏zang在zai大da數shu據ju中zhong,利li用yong大da數shu據ju技ji術shu整zheng合he計ji算suan和he處chu理li資zi源yuan有you助zhu於yu更geng有you針zhen對dui性xing地di應ying對dui信xin息xi安an全quan威wei脅xie,有you助zhu於yu找zhao到dao攻gong擊ji的de源yuan頭tou。
保障我國大數據信息安全的建議
一yi是shi重zhong視shi大da數shu據ju及ji其qi信xin息xi安an全quan體ti係xi建jian設she。大da數shu據ju作zuo為wei一yi個ge較jiao新xin的de概gai念nian,目mu前qian尚shang未wei直zhi接jie以yi專zhuan有you名ming詞ci被bei我wo國guo政zheng府fu提ti出chu來lai給gei予yu政zheng策ce支zhi持chi。在zai物wu聯lian網wang“十二五”規劃中,信息處理技術作為4項關鍵技術創新工程之一被提出來,其中包括了海量數據存儲、數據挖掘、圖(tu)像(xiang)視(shi)頻(pin)智(zhi)能(neng)分(fen)析(xi),這(zhe)都(dou)是(shi)大(da)數(shu)據(ju)的(de)重(zhong)要(yao)組(zu)成(cheng)部(bu)分(fen)。在(zai)對(dui)大(da)數(shu)據(ju)發(fa)展(zhan)進(jin)行(xing)規(gui)劃(hua)時(shi),建(jian)議(yi)加(jia)大(da)對(dui)大(da)數(shu)據(ju)信(xin)息(xi)安(an)全(quan)形(xing)勢(shi)的(de)宣(xuan)傳(chuan)力(li)度(du),明(ming)確(que)大(da)數(shu)據(ju)的(de)重(zhong)點(dian)保(bao)障(zhang)對(dui)象(xiang),加(jia)強(qiang)對(dui)敏(min)感(gan)和(he)要(yao)害(hai)數(shu)據(ju)的(de)監(jian)管(guan),加(jia)快(kuai)麵(mian)向(xiang)大(da)數(shu)據(ju)的(de)信(xin)息(xi)安(an)全(quan)技(ji)術(shu)的(de)研(yan)究(jiu),培(pei)養(yang)大(da)數(shu)據(ju)安(an)全(quan)的(de)專(zhuan)業(ye)人(ren)才(cai),建(jian)立(li)並(bing)完(wan)善(shan)大(da)數(shu)據(ju)信(xin)息(xi)安(an)全(quan)體(ti)係(xi)。
二是加快大數據安全技術研發。雲計算、物聯網、移動互聯網等新技術的快速發展,為大數據的收集、處(chu)理(li)和(he)應(ying)用(yong)提(ti)出(chu)了(le)新(xin)的(de)安(an)全(quan)挑(tiao)戰(zhan)。建(jian)議(yi)加(jia)大(da)對(dui)大(da)數(shu)據(ju)安(an)全(quan)保(bao)障(zhang)關(guan)鍵(jian)技(ji)術(shu)研(yan)發(fa)的(de)資(zi)金(jin)投(tou)入(ru),提(ti)高(gao)我(wo)國(guo)大(da)數(shu)據(ju)安(an)全(quan)技(ji)術(shu)產(chan)品(pin)水(shui)平(ping)。推(tui)動(dong)基(ji)於(yu)大(da)數(shu)據(ju)的(de)安(an)全(quan)技(ji)術(shu)研(yan)發(fa),研(yan)究(jiu)基(ji)於(yu)大(da)數(shu)據(ju)的(de)網(wang)絡(luo)攻(gong)擊(ji)追(zhui)蹤(zong)方(fang)法(fa),搶(qiang)占(zhan)發(fa)展(zhan)基(ji)於(yu)大(da)數(shu)據(ju)的(de)安(an)全(quan)技(ji)術(shu)的(de)先(xian)機(ji)。
三(san)是(shi)加(jia)強(qiang)對(dui)重(zhong)點(dian)領(ling)域(yu)敏(min)感(gan)數(shu)據(ju)的(de)監(jian)管(guan)。海(hai)量(liang)數(shu)據(ju)的(de)彙(hui)集(ji)加(jia)大(da)了(le)敏(min)感(gan)數(shu)據(ju)暴(bao)露(lu)的(de)可(ke)能(neng)性(xing),對(dui)大(da)數(shu)據(ju)的(de)無(wu)序(xu)使(shi)用(yong)也(ye)增(zeng)加(jia)了(le)要(yao)害(hai)信(xin)息(xi)泄(xie)露(lu)的(de)危(wei)險(xian)。在(zai)政(zheng)府(fu)層(ceng)麵(mian),建(jian)議(yi)明(ming)確(que)重(zhong)點(dian)領(ling)域(yu)數(shu)據(ju)庫(ku)範(fan)圍(wei),製(zhi)定(ding)完(wan)善(shan)的(de)重(zhong)點(dian)領(ling)域(yu)數(shu)據(ju)庫(ku)管(guan)理(li)和(he)安(an)全(quan)操(cao)作(zuo)製(zhi)度(du),加(jia)強(qiang)日(ri)常(chang)監(jian)管(guan)。在(zai)企(qi)業(ye)層(ceng)麵(mian),建(jian)議(yi)加(jia)強(qiang)企(qi)業(ye)內(nei)部(bu)管(guan)理(li),製(zhi)定(ding)設(she)備(bei)特(te)別(bie)是(shi)移(yi)動(dong)設(she)備(bei)安(an)全(quan)使(shi)用(yong)規(gui)程(cheng),規(gui)範(fan)大(da)數(shu)據(ju)的(de)使(shi)用(yong)方(fang)法(fa)和(he)流(liu)程(cheng)。
四是運用大數據技術應對高級可持續攻擊。傳統安全防禦措施很難檢測出高級持續性攻擊。安全廠商要利用大數據技術對事件的模式、攻擊的模式、shijianhekongjianshangdetezhengjinxingchuli,zongjiechouxiangchuyixiemoxing,bianchengdashujuanquangongju。weilejingzhundimiaoshuweixietezheng,jianmoguochengkenenghuihaofeijigeyueshenzhijinian,binghaofeidaliangrenli、物力、財(cai)力(li)。建(jian)議(yi)整(zheng)合(he)大(da)數(shu)據(ju)處(chu)理(li)資(zi)源(yuan),協(xie)調(tiao)大(da)數(shu)據(ju)處(chu)理(li)和(he)分(fen)析(xi)機(ji)製(zhi),推(tui)動(dong)重(zhong)點(dian)數(shu)據(ju)庫(ku)之(zhi)間(jian)的(de)數(shu)據(ju)共(gong)享(xiang),加(jia)快(kuai)對(dui)高(gao)級(ji)可(ke)持(chi)續(xu)攻(gong)擊(ji)的(de)建(jian)模(mo)進(jin)程(cheng),消(xiao)除(chu)和(he)控(kong)製(zhi)高(gao)級(ji)可(ke)持(chi)續(xu)攻(gong)擊(ji)的(de)危(wei)害(hai)。
(作者單位:工業和信息化部賽迪智庫)