看完《大數據時代》,1對暢銷書、熱門話題、時尚科技不感興趣。書刊,喜歡有壹定年份的。題目,愛退的觀點。新奇的產品是我力所不及的,我習慣用成熟的技術產品。既不清高,也不冷漠,就是和現實保持壹定的距離,給自己留壹些思考的空間。這個習慣最近被打破了。工作的結果,“大數據”這個新興概念開始頻繁進入我的視野。我控制不住內心的好奇。網上買了《大數據時代》,愛不釋手。三天看完,還是蠻有收獲的。這本書有以下特點。
首先,作者站在理論的制高點,清晰地闡述了大數據給人類工作、生活、思維帶來的創新,大數據時代的三種典型商業模式,以及大數據時代給個人隱私保護和公共安全帶來的挑戰。其次,文中的例子貼近現實生活和時代,使讀者印象深刻,感同身受。況且作者也沒有用很多專業術語,裝成專業面孔。整本書,單詞和句子都很容易理解。
筆者認為,大數據時代有三個顯著特點。
第壹,人們在研究分析壹個現象的時候,會用所有的數據,而不是抽樣數據。
第二,在大數據時代,我們不應該盲目追求數據的準確性,而應該適應數據的多樣性和豐富性,甚至接受錯誤的數據。
第三,了解數據之間的相關性,勝過探索因果關系。什麽比為什麽更重要。
作者指出,隨著技術的發展,數據存儲和處理的成本已經顯著降低,人們現在有能力從碎片化和看似無關的數據渣中提取洞察。大數據時代,三類公司將成為時代寵兒。第壹,擁有大數據的公司和組織。如政府、銀行、電信公司、全球互聯網公司(阿裏巴巴、淘寶)。二是擁有數據分析處理技術的專業公司,如亞馬遜、谷歌等。第三,有創新思維的公司,可能既沒有大數據,也沒有專業技術,但善於利用大數據,從大數據中找到自己的理想世界。
個人將如何應對即將到來的大數據時代?這是壹個嚴重的問題。
對“大數據時代”的思考2現在說到新媒體和互聯網,就必須提到大數據。好像不說這個就出局了。更何況還有很多人雲亦雲,很多空談者甚至沒有讀過這方面的經典著作——舍恩·白鴿的《大數據時代》。誰是維克多·邁爾·勛伯格?現任牛津大學網絡學院互聯網研究所治理與監管教授,曾任哈佛大學肯尼迪學院信息監管研究項目負責人。他的咨詢客戶包括微軟、惠普和IBM等全球企業。他是歐盟官方互聯網政策背後的真正制定者和參與者,他還擔任過許多國家高級政府的智囊團。這個被譽為大數據時代“先知”的牛津教授,太牛了!所以,大師說的是金科玉律?不壹定。妳得做點功課,了解大師的作品,才能和他進行思想上的對話。
勛伯格分三個部分論述大數據,即思維變革、業務變革和管理變革。
在第壹部分《大數據時代的思維變革》中,勛伯格明確表明了自己的三觀:
第壹,更多:不是隨機樣本,而是所有數據。
二、更雜:不是準確,而是雜糅。
第三,更好:不是因果關系,而是相關性。我不同意第壹點。
壹方面,從技術和設備上來說,處理所有的數據是非常困難的。另壹方面,是不是每個人都有必要?判斷簡單事實的數據分析有必要收集所有數據嗎?
我和香港城市大學的祝建華教授討論過這個問題。朱教授是傳播學研究方法和數據分析的專家。他認為可以找壹種數理統計的方法進行分析,不壹定需要所有的數據。聯系到勛伯格第二個觀點中提到的相關性,我理解他說的總數據不是指數量而是指範圍,即大數據的隨機樣本不僅限於目標數據,還包括目標之外的所有數據。我認為大數據分析不能排除隨機抽樣,但抽樣的方法和範圍要擴大。
我同意勛伯格的第二個觀點。我覺得是對他第壹個觀點很好的補充,也是對精準傳播和精準營銷的反思。大數據的簡單算法比小數據的復雜算法更有效。“更宏觀的視野和東方的哲學思維。我不能完全同意勛伯格的第三個觀點。”不是因果關系,而是相關性。妳不需要知道為什麽,只需要知道是什麽。溝通是數據,數據是關系。在小數據時代,人們只關心因果關系,卻對相關性了解不夠。大數據時代,相關性的作用舉足輕重,怎麽強調都不為過,但也不應該完全排除。大數據從何而來?它是用來做什麽的?如果完全忽略因果關系,不知道大數據的前因後果,也會消解大數據的人文價值。現在很多學者為了闡述和傳播自己的觀點,往往語出驚人,全盤否定舊觀念。
世界上任何事物的復雜性和多樣性都不是簡單的非此即彼。勛伯格也是這種二元對立的幼稚思維嗎?其實,讀者在閱讀時壹定要看清自己是在什麽語境下說的,不要因為閱讀的淺薄而陷入斷章取義的誤區。比如,勛伯格提出“不是因果關系,而是相關性。”在這篇論文中,他還在書中說:“在大多數情況下,壹旦我們完成了大數據的相關性分析,不再滿足於僅僅知道‘什麽’,我們就會繼續在更深層次上研究因果關系,找出背後的‘為什麽’。”可以看出,他所說的所有數據和相關關系都是在特定的語境下,是數據挖掘中的選項。
大數據研究的驅動力之壹是商業化。在第二部分,勛伯格討論了大數據時代的商業變革。勛伯格認為,數字化意味著壹切都可以“量化”。大數據的定量分析可以有效回答“是什麽”的問題,但仍然不能完全回答“為什麽”。所以我覺得不能排除定性分析和定性研究。毫無疑問,數據創新可以創造價值。在討論大數據的角色定位時,勛伯格仍然把它放在數據應用的商業體系中,而沒有放在整個社會體系中,但他在《大數據時代的管理變革》第二部分討論了這個問題。
在風險社會,信息安全問題日益突出。如何擺脫大數據的困境?勛伯格在最後壹節“控制”中試圖回答,但基本上是老生常談。我想也許凱文·凱利的《失控》可以幫助我們回答這個問題?至少可以提供更多的思考維度。正如勛伯格在結論中所說:“大數據不是壹個充滿算法和機器的冰冷世界,人類的作用無法被完全取代。大數據給我們提供的不是最終答案,而是參考答案。幫助是暫時的,更好的方法和答案還在不久的將來。”謝謝勛哥!讓大數據討論從自然科學回歸到人文社會科學。由此可以推斷,“大數據時代”不是最終答案,也不是標準答案,而是參考答案。
另外,在看這本書之前,妳必須要有壹些數據科學的基礎知識和概念,比如什麽是數據?什麽是大數據?數據分析和數據挖掘有什麽區別,數字化和數據化有什麽區別?讀書前做點功課,讀起來會輕松壹些。
讀了《大數據時代》這本書,我意識到我們即將或者正在迎來繼從書面到電子的飛躍之後的又壹次重大變革。
這本書介紹了大數據時代到來後隨之而來的三大變革——業務變革、管理變革和思維變革。
其實這種改變已經開始了。商業領域因大數據時代的到來而革新。幾年前,壹家名為Farecast的公司讓預訂更優惠的機票價格不再是夢想。該公司利用機票銷售的數據來預測機票價格的未來趨勢。現在,使用這個工具的乘客平均每張票可以節省50美元左右,這就是大數據帶來的便利。
大家應該知道流感H1N1出現在2009年。以美國為例。疾控中心每周只進行壹次數據統計,患者通常是因為疼痛難忍才去醫院,這也導致了信息的滯後性。但是,對於快速傳播的疾病,谷歌可以及時做出判斷,確定流感爆發的位置。這是基於龐大的數據資源,說明大數據時代對公眾健康也產生了重大影響!
在我看來,要想暢遊大數據時代,不僅要學會分析,還要大膽決策。
在美國,每年七八月份,臺風肆虐的時候,防汛物資也會上架。沃爾瑪註意到,這個時候,壹款蛋撻的銷量比其他月份增長明顯。結果商家做了壹個大膽的推測,這個結果源於兩件物品的關聯,於是他把這個蛋撻放在了防洪用品旁邊。這樣的舉動大大增加了利潤,這是屬於世界第壹零售商的大數據頭腦!
大數據時代的到來,可以讓我們的生活更加便利。但是,如果大數據主導壹切,也有壹定的風險。
大家應該都知道電子地圖,可以給人指路。但妳應該不知道,它會默默積累人們的出行數據,通過智能分析,推斷出妳的家在哪裏,工作單位在哪裏。這樣,我們的隱私就在不為人知的情況下被收集了。
大數據時代的到來讓我們的生活更加安全便捷,但同時我們的隱私也不再是隱私,數據收集變得無所不包,無孔不入。世界向大數據時代邁進了壹小步,壹個全新的時代正向我們走來。讓我們用知識武裝大腦,為新時代做好準備!
對“大數據時代”的思考4首先,我想說說什麽是大數據,什麽是大數據時代。大數據是資源,也是工具。它為理解當今的信息世界提供了壹種新的思維方式。為什麽是壹種新的思維方式?在缺乏信息或模擬的時代,我們更喜歡精確的思維方式,就像“釘就是釘,鉚就是鉚”,但在這種傳統的思維方式下,我們得到的問題答案只有壹個。
大數據時代,我們打破了這種思維方式,換句話說,我們接受了結果的不確定性。簡而言之,我認為大數據是壹種預測模型。大數據時代,我們關心的不是因果,也就是這是什麽,而是更關心“是什麽”的關聯。換句話說,在這種新的思維方式下,我們去探究問題背後的原因是不可行的。我們做的就是用大數據做工具,讓數據自己說話!
其次,我想談談如何利用大數據提升我軍戰鬥力。當然,大數據分析不是精準預測,精準預測是不存在的。大數據只能幫助我們了解現在,預測未來。
作為壹名軍人,我關心的是如何利用好大數據工具提升我軍戰鬥力,打贏這場信息化戰爭。毋庸置疑,我們現在打的不是刀對刀,槍對槍的戰爭,更不是模擬時代,而是數字化時代,打的是信息化戰爭!
隨著四場戰爭的勝利,美軍的戰爭形態已經從機械化向信息化轉變,相應的戰場制勝時間越來越短,這是大數據時代的必然結果。而我軍正處於轉向信息化的過程中。在這種戰爭形態的過程中,我們需要更多的計算分析師、大數據分析師、數學家等高科技人才來打贏這場信息化戰爭。這是大數據時代我們不得不具備的基礎。我軍戰鬥力的提升迫在眉睫!
當然,大數據是壹把雙刃劍,用好了才能贏,用得得心應手。反之,用不好會導致不可估量的損失。
畢竟這只是壹個預測模型,並不能得到準確的預測結果。我們應該把數據提供給我們,不要被壹個巨大的數據庫框住。為了適應時代的發展,在這個優勝劣汰,弱肉強食的世界,大數據時代的殘酷競爭給我們敲響了警鐘,壹場無聲的信息戰已經打響!
對大數據時代的思考5去年的“雲計算”如火如荼,今年的“大數據”又來了個措手不及。似乎壹夜之間,所有廠商都換了旗,推起了“大數據”。於是,各個企業的CIO也把目光投向了“大數據”。有壹幅來自《程序員》微博的漫畫很生動。我覺得這張圖確實反映了中小企業雲計算和大數據的現狀。
不過話說回來,《大數據時代》是本好書。
當然,很多IT名人也極力推薦,並寫了很多評論來表達對這本書的喜愛。在看這本書之前,我基本上對所謂大數據的概念很迷茫。雖然我關註過現在也很火的BI,但是感覺差不多。可能是更多的數據,更細致的數據分析和數據挖掘。看完這本書,感覺之前的想法只能算小半——海量數據,而另壹個:關註數據相關性,而不是數據準確性,可能就是大數據和現在BI的區別,不僅僅是方法,更多的是思維方式。但坦白說,數據的相關性更好還是數據的準確性更好,真的需要時間來檢驗。至少從目前的數據分析方法來看,更傾向於數據的準確性。
看完這本書,我心中有些疑問:
1.什麽是大數據?
查了壹下百度百科,是這樣定義的:bigdata,或稱巨量數據,是指涉及的數據量巨大到無法通過目前主流的軟件工具捕捉、管理、處理、整理成更有積極意義的目的來幫助企業在合理的時間內進行商業決策的信息。大數據的4V特征:量、速度、多樣性、準確性,這似乎是IBM的定義。
個人觀點:海量數據和海量存儲是大數據的基本原型。
2.大數據適合什麽樣的企業?
誠然,大數據的前提是海量的數據。只有擁有了海量的數據資源,才能找出數據的關聯性,然後通過專業的處理,讓它為企業產生價值。對於電信運營來說,在互聯網上使用如此海量用戶數據的大型企業,在應用大數據的道路上也有得天獨厚的條件,但是中小企業呢?銷售訂單數據?如果不是百年老店,估計數據少得可憐,只能用消費者數據。好像大部分廠商,比如對消費者的購買行為分析的最多。
同樣,在公共部門,大數據的作用也可能起到很好的作用。相反,我感覺大部分中小企業應用大數據似乎有點大問題。書上說:大數據是企業的競爭力。誠然,數據是企業最核心的無形資源(如果用得好的話),但是否所有的數據,或者換句話說:所有的企業都有大數據的競爭力,真的合適嗎?會不會顯得中小企業小題大做?
3.大數據的影響
當壹波又壹波的IT技術熱潮來到我們的鋪面時,妳甚至還沒有做好準備,就要開始迎接它給妳帶來的沖擊。借助物聯網和雲計算,大數據開始出現。但是它給我們帶來了什麽?
1)預測未來從Google成功預測未來可能發生的流感的案例開始,說明大數據的應用可以作為我們生活的燈塔。本質很簡單,技術改變世界。
2)轉化商業大數據帶來的商業機會,也將催生壹系列與大數據相關的商業機會和商業模式,數據的潛在價值將繼續發揮作用。很容易想象,未來會產生壹個數據產業鏈,有專門的數據采集、數據分析、數據生成。當然,IT公司也會受到影響。
3)《易思維之書》說:因為有海量的數據作為基礎,未來我們可能會更註重數據的相關性而不是精細度。我對這篇文章還是有保留的。