有了大數據,咨詢行業的定性研究還有價值嗎?
1大數據的興起,預示著“信息時代”進入了壹個新的階段。1我們對大數據要有歷史的眼光。與農業和工業時代相比,信息時代是壹個漫長的時代。不同時期的生產要素和社會發展動力有明顯的差異。信息時代標誌性的技術發明是數字計算機、集成電路、光纖通信和互聯中國(World Wide China)。雖然媒體上有大量“大數據時代”的說法,但大數據、雲計算等新技術尚未取得可與上述劃時代技術發明相媲美的技術突破,難以形成超越信息時代的新時代。信息時代可以分為幾個階段,大數據等新技術的應用預示著信息社會將進入壹個新的階段。通過考察和分析100多年的漫長歷史,可以發現信息時代和工業時代的發展規律有很多相似之處。電氣化時代提高生產力的過程與信息時代驚人的相似。只是經過20~30年的擴散儲備,增加才比較明顯。分割線分別是1915和1995。我猜測,經過幾十年的信息技術傳播,21世紀的前30年可能是信息技術提升生產力的黃金時代。1.2從“信息時代新階段”的高度理解“大數據”中國已經開始進入信息時代,但是很多人的思想還停留在工業時代。經濟和科學工作中的許多問題,根源在於對時代的認識不足。中國在18-19世紀被打得落後,是因為滿清政府沒有意識到時代變了,我們不能重蹈歷史覆轍。中央提出中國經濟進入“新常態”後,媒體上有很多討論,但大多是對經濟增速放緩的解釋,很少有從時代變遷的角度探討“新常態”的文章。筆者認為,經濟新常態意味著我國進入了以信息化推進新型工業化、城鎮化、農業現代化的新階段,這是經濟社會管理的壹次飛躍,不是權宜之計,更不是倒退。由大數據、移動互聯網中國、社交中國網、雲計算、IOT中國等新壹代信息技術組成的IT架構“第三平臺”,是信息社會進入新階段的標誌,對整個經濟的變革具有引領和帶動作用。媒體上經常出現的互聯網中國、創客、“第二次機器革命”、“工業4.0”,都與大數據、雲計算有關。大數據和雲計算是新常態下提高生產力的新杠桿。所謂創新驅動發展,主要依靠信息技術提高生產力。1.3大數據可能是中國信息產業從跟蹤到領先的突破口。中國的大數據企業已經有了很好的基礎。全球十大互聯互通中國服務企業中國占四席(阿裏巴巴、騰訊、百度、京東。COM),另外6家Top10互聯中國服務企業都是美國企業。歐洲和日本沒有互聯互通的中國企業進入Top10。這表明中國企業在基於大數據的互聯網中國服務業務方面已經走在了世界前列。在大數據技術的發展上,中國可能會改變過去30年技術受制於人的局面,中國可能會在世界大數據的應用上起到引領作用。但是,企業走在世界前列,並不代表中國在大數據技術上領先。事實上,目前國際上流行的大數據主流技術,沒有壹項是中國首創的。開源社區和眾包是發展大數據技術和產業的重要途徑,但我們對開源社區的貢獻很小。在全球近萬名社區核心誌願者中,中國可能不到200人。要吸取以往基礎研究為企業提供核心技術不足的教訓,加強大數據基礎研究和前瞻性技術研究,努力攻克大數據核心和關鍵技術。2理解大數據需要上升到文化和認識論的高度。2.1數據文化是壹種先進的文化。數據文化的本質是尊重客觀世界的實事求是精神,數據就是事實。重視數據,就是強調用事實說話,理性思考的科學精神。中國人的傳統習慣是定性思維,而不是定量思維。目前很多城市都在開放政府數據,但是發現大多數人對政府要開放的數據並不感興趣。要讓大數據走上健康發展的軌道,首先要大力弘揚數據文化。本文所說的數據文化,不僅僅是文藝、出版等文化行業使用的大數據,而是指全民的數據意識。全社會要認識到,信息化的核心是數據,只有政府和公眾重視數據,才能真正理解信息化的本質;數據是壹種新的生產要素,大數據的運用可以改變資本、土地等傳統要素在經濟中的權重。有人把上帝和數據之間的舞蹈總結為美國文化的特征之壹,說美國人既有對上帝的真誠,也有通過數據尋求真理的理性。美國完成了數據文化從鍍金時代到進步時代的思維轉型。南北戰爭後,普查方法被應用到許多領域,形成了數據預測和分析的思維模式。在過去的壹個世紀中,美國和西方國家的現代化與數據文化的傳播和滲透密切相關,中國要實現現代化也必須強調數據文化。提高數據意識的關鍵是理解大數據的戰略意義。數據是與物質和能源同等重要的戰略資源。數據收集和分析涉及到每個行業,是壹項全局性、戰略性的技術。從硬技術向軟技術轉變是全球技術發展趨勢,從數據中發現價值的技術是最具活力的軟技術。數據技術和數據產業的落後會像錯過工業革命的機會壹樣耽誤壹個時代。2.2理解大數據需要正確的認識論。在歷史上,科學研究是從邏輯推導開始的,歐幾裏得幾何的所有定理都可以從幾個公理推導出來。從伽利略、牛頓開始,科學研究更加註重自然觀察和實驗觀察,在觀察的基礎上,用歸納法提煉科學理論。“科學始於觀察”已經成為科學研究和認識論的主流。經驗主義和理性主義都為科學的發展做出了巨大貢獻,但也暴露出了明顯的問題,甚至走向了極端。理性主義走向極端,成為康德批判的教條主義,經驗主義走向極端,成為懷疑主義和不可知論。20世紀30年代,德國哲學家波普爾提出了壹種被後人稱為“證偽主義”的認識論觀點。他認為科學理論不能被歸納證明,只能被實驗發現的反例證偽,所以他否認科學始於觀察,提出了著名的“科學始於問題”的觀點[3]。證偽主義有其局限性。如果嚴格遵守證偽定律,萬有引力定律、原子論等重要理論都可能被早期的所謂反例扼殺。但“科學始於問題”的觀點對大數據技術的發展具有指導意義。大數據的興起引發了新的科研模式:“科學始於數據”。從認識論的角度看,大數據分析方法接近“科學始於觀察”的經驗主義,但要牢記歷史的教訓,避免滑入否定理論作用的經驗主義泥坑。強調“相關性”時不要懷疑“因果關系”的存在;在宣示大數據的客觀性和中立性時,不要忘記,無論數據的大小,大數據總會受到自身的局限和人類的偏見。不要相信預言:“有了大數據挖掘,妳不需要問任何關於數據的問題,數據會自動生成知識”。面對海量如海的數據,從事數據挖掘的科技人員最大的困惑是,我們要抓的“針”是什麽?這海裏有“針”嗎?換句話說,我們需要知道問題是什麽。從這個意義上說,“科學始於數據”和“科學始於問題”應該是有機結合的。對“事業”的追求是科學發展的永恒動力。然而,原因是無窮無盡的,人類不可能在有限的時間內找到“終極真理”。在科學探索的路上,人們常常用“這是客觀規律”來解釋世界,而不是馬上。