詳情描述
什么是大數(shù)據(jù)?我們可以看出大數(shù)據(jù)的一些關(guān)鍵特征,比如容量大、類型多、關(guān)聯(lián)性強(qiáng)、有價(jià)值等等。“大數(shù)據(jù)是以高容量、多樣性、存取速度快、應(yīng)用價(jià)值高為主要特征的數(shù)據(jù)集合,正快速發(fā)展為對(duì)數(shù)量巨大、來(lái)源分散、格式多樣的數(shù)據(jù)進(jìn)行采集、存儲(chǔ)和關(guān)聯(lián)分析,從中發(fā)現(xiàn)新知識(shí)、創(chuàng)造新價(jià)值、提升新能力的新一代信息技術(shù)和服務(wù)業(yè)態(tài)?!?/p>
大數(shù)據(jù),顧名思義,“大”該是應(yīng)有之義?!按髷?shù)據(jù)的定義較初與容量有關(guān)系?!崩罟谟罘治稣f(shuō),業(yè)界有幾種對(duì)大數(shù)據(jù)的定義,其中一個(gè)共同點(diǎn)就是數(shù)據(jù)的容量超出了原有的存儲(chǔ)、管理和處理能力。
正如中國(guó)電子信息產(chǎn)業(yè)發(fā)展研究院副院長(zhǎng)樊會(huì)文接受記者采訪時(shí)指出的,大數(shù)據(jù)概念產(chǎn)生就是因?yàn)閿?shù)據(jù)量和數(shù)據(jù)類型急劇增加,以至于原有的數(shù)據(jù)存儲(chǔ)、傳輸、處理以及管理技術(shù)不能勝任,需要全新的技術(shù)工具和手段。
信息技術(shù)日新月異,大數(shù)據(jù)的定義也在發(fā)生變化。工信部賽迪研究院軟件所所長(zhǎng)潘文說(shuō),數(shù)據(jù)即時(shí)處理的速度(Velocity)、數(shù)據(jù)格式的多樣化(Variety)與數(shù)據(jù)量的規(guī)模(Volume)被稱為大數(shù)據(jù)“3V”。
對(duì)于“多大容量的數(shù)據(jù)才算大數(shù)據(jù)”,潘文說(shuō),大數(shù)據(jù)的規(guī)模并沒有具體的標(biāo)準(zhǔn),僅僅規(guī)模大也不能算作大數(shù)據(jù)。規(guī)模大本身也要從兩個(gè)維度來(lái)衡量,一是從時(shí)間序列累積大量的數(shù)據(jù),二是在深度上更加細(xì)化的數(shù)據(jù)。
大數(shù)據(jù)培訓(xùn)機(jī)構(gòu)
李冠宇說(shuō),比如一份現(xiàn)在看起來(lái)很小的數(shù)據(jù),但是縱向積累久了也可以變成大數(shù)據(jù),橫向與其他數(shù)據(jù)關(guān)聯(lián)起來(lái)也可能形成大數(shù)據(jù)。而一份很大的數(shù)據(jù)如果沒有關(guān)聯(lián)性、沒有價(jià)值也不是大數(shù)據(jù)。
運(yùn)滿滿研究院院長(zhǎng)徐強(qiáng)認(rèn)為,“大”是必要條件,但非充分條件?;谝苿?dòng)互聯(lián)網(wǎng)用戶規(guī)模紅利,國(guó)內(nèi)平臺(tái)型企業(yè)比較容易獲取大量數(shù)據(jù),但數(shù)據(jù)不是越多越好,無(wú)用數(shù)據(jù)就像噪音,會(huì)給數(shù)據(jù)分析、清洗、脫敏和可視化帶來(lái)負(fù)擔(dān)。
這也正如阿里巴巴集團(tuán)董事局主席馬云在某次演講中說(shuō)的:“很多人以為大數(shù)據(jù)就是數(shù)據(jù)量很大,其實(shí)大數(shù)據(jù)的大是大計(jì)算的大,大計(jì)算+數(shù)據(jù),稱之為大數(shù)據(jù)?!?/p>
大數(shù)據(jù)培訓(xùn)機(jī)構(gòu)哪家好?北大青鳥佳音校區(qū)大數(shù)據(jù)培訓(xùn)值得您選擇!