這樣,通過數據對比,壹方面可以剔除偶然性和外界環境幹擾帶來的噪聲,另壹方面通過數據積累,可以找到規律的異常波動與結果的對應關系,從而實現對異常變化的分析和預測。
只要數據全面連續,就能發現異常變化的跡象。傳統的統計抽樣數據需要從數據中進行抽樣,當時的狀態可以通過單個數據的準確性來反映,但無法進行定期分析。
所以大數據的原理是,基於每壹個非常規的變化,事前都要有征兆。沒有什麽是突然的,這和佛教哲學中的因果道理是壹樣的。壹切都有跡可循。
大數據的預測和分析是建立在捕捉和分析這些變化跡象的能力上的,而最容易捕捉到這種跡象的領域,壹定是規律穩定的領域。
我們舉壹些現實生活中的例子。
1,股市
可以用大數據預測股票漲跌嗎?不討論個股的話,在美國理論上是可以的,但在中國難度很大。
美國股票市場可以雙向獲利。當股價脫離價值時,另壹股資本力量就會反方向運作,從而獲利。中國股市則不同。股票漲了才能盈利。這樣的規則會吸引壹些遊資利用不對等的信息,人為地改變股市的規則。沒有壹個相對穩定的狀態,很難被預測,或者變量太大,以至於捕捉和分析的成本太高。
2.商品價格
壹次性銷售的商品價格是可以預測的,因為任何商品的銷售都離不開賺錢的基本面,而在充分競爭的環境下,不同渠道的成本和收入需求是相對穩定的,價格相關的變量也是相對固定的,所以價格是可以預測的。
但如果有後續服務等持續性收費,或者產品盈利不是唯壹需求(比如產品新上市促銷,競爭對手新上市等。),產品的價格因為脫離了穩定狀態而變得不可預測。
3.人們的健康狀況
慢性病是可以預測的。因為人體體征的變化是固定的,所以在慢性病的形成過程中,體征的變化也是持續的、異常的。因此,在慢性病的形成過程中,我們可以分析異常體征的變化。
急性病很難預測,因為是外界因素引起的突變。體征數據的異常變化是壹種應激反應,屬於突然變化的過程,特別是隨機性,所以預測成本過高,但可以在發生後進行分析。
1,數據波動規律不因外界隨機幹擾而不可預測,基準規律可由固定維數的變量建立;
2.持續收集和分析數據的成本小於預測帶來的收益;
3.異常情況與不同結果之間存在對應關系。