當前位置:股票大全官網 - 基金投資 - 大數據時代什麽最重要

大數據時代什麽最重要

隨著雲時代的來臨,大數據(Big data)也吸引了越來越多的關註。《著雲臺》的分析師團隊認為,大數據(Big data)通常用來形容壹個公司創造的大量非結構化和半結構化數據,這些數據在下載到關系型數據庫用於分析時會花費過多時間和金錢。大數據分析常和雲計算聯系到壹起,因為實時的大型數據集分析需要像MapReduce壹樣的框架來向數十、數百或甚至數千的電腦分配工作。

簡言之,從各種各樣類型的數據中,快速獲得有價值信息的能力,就是大數據技術。明白這壹點至關重要,也正是這壹點促使該技術具備走向眾多企業的潛力。 大數據的4個“V”,或者說特點有四個層面:第壹,數據體量巨大。從TB級別,躍升到PB級別;第二,數據類型繁多。前文提到的網絡日誌、視頻、圖片、地理位置信息等等。第三,價值密度低。以視頻為例,連續不間斷監控過程中,可能有用的數據僅僅有壹兩秒。第四,處理速度快。1秒定律。最後這壹點也是和傳統的數據挖掘技術有著本質

的不同。業界將其歸納為4個“V”——Volume,Variety,Value,Velocity。 物聯網、雲計算、移動互聯網、車聯網、手機、平板電腦、PC以及遍布地球各個角落的各種各樣的傳感器,無壹不是數據來源或者承載的方式 著雲臺

例子包括網絡日誌,RFID,傳感器網絡,社會網絡,社會數據(由於數據革命的社會),互聯網文本和文件;互聯網搜索索引;呼叫詳細記錄,天文學,大氣科學,基因組學,生物地球化學,生物,和其他復雜和/或跨學科的科研,軍事偵察,醫療記錄;攝影檔案館視頻檔案;和大規模的電子商務。

大的數據需要特殊的技術,以有效地處理大量的容忍經過時間內的數據。適用於大數據的技術,包括大規模並行處理(MPP)數據庫,數據挖掘電網,分布式文件系統,分布式數據庫,雲計算平臺,互聯網,和可擴展的存儲系統。

壹些但不是所有的MPP的關系數據庫的PB的數據存儲和管理的能力。隱含的負載,監控,備份和優化大型數據表的使用在RDBMS的。

斯隆數字巡天收集在其最初的幾個星期,比在天文學的歷史,早在2000年的整個數據收集更多的數據。自那時以來,它已經積累了140兆兆 字節的信息。這個望遠鏡的繼任者,大天氣巡天望遠鏡,將於2016年在網上和將獲得的數據,每5天沃爾瑪處理超過100萬客戶的交易每隔壹小時,反過來進口量數據庫估計超過2.5 PB的是相當於167次,在美國國會圖書館的書籍 。

FACEBOOK處理400億張照片,從它的用戶群。解碼最初的人類基因組花了10年來處理時,現在可以在壹個星期內實現。

“大數據”的影響,增加了對信息管理專家的需求,甲骨文,IBM,微軟和SAP花了超過15億美元的在軟件智能數據管理和分析的專業公司。這個行業自身價值超過1000億美元,增長近10%,每年兩次,這大概是作為壹個整體的軟件業務的快速。 大數據已經出現,因為我們生活在壹個社會中有更多的東西。有46億全球移動電話用戶有1億美元和20億人訪問互聯網。

基本上,人們比以往任何時候都與數據或信息交互。 1990年至2005年,全球超過1億人進入中產階級,這意味著越來越多的人,誰收益的這筆錢將成為反過來導致更多的識字信息的增長。思科公司預計,到2013年,在互聯網上流動的交通量將達到每年667艾字節。

最早提出“大數據”時代已經到來的機構是全球知名咨詢公司麥肯錫。麥肯錫在研究報告中指出,數據已經滲透到每壹個行業和業務職能領域,逐漸成為重要的生產因素;而人們對於海量數據的運用將預示著新壹波生產率增長和消費者盈余浪潮的到來。

“麥肯錫的報告發布後,大數據迅速成為了計算機行業爭相傳誦的熱門概念,也引起了金融界的高度關註。”隨著互聯網技術的不斷發展,數據本身是資產,這壹點在業界已經形成***識。“如果說雲計算為數據資產提供了保管、訪問的場所和渠道,那麽如何盤活數據資產,使其為國家治理、企業決策乃至個人生活服務,則是大數據的核心議題,也是雲計算內在的靈魂和必然的升級方向。”

事實上,全球互聯網巨頭都已意識到了“大數據”時代,數據的重要意義。包括EMC、惠普(微博)、IBM、微軟(微博)在內的全球IT 巨頭紛紛通過收購“大數據”相關廠商來實現技術整合,亦可見其對“大數據”的重視。

“大數據”作為壹個較新的概念,目前尚未直接以專有名詞被我國政府提出來給予政策支持。不過,在12月8日工信部發布的物聯網“十二五”規劃上,把信息處理技術作為4項關鍵技術創新工程之壹被提出來,其中包括了海量數據存儲、數據挖掘、圖像視頻智能分析,這都是大數據的重要組成部分。而另外3項關鍵技術創新工程,包括信息感知技術、信息傳輸技術、信息安全技術,也都與“大數據”密切相關。