維克托·邁爾舍恩伯格在他的《大數據時代》壹書中寫道:“大數據時代最大的轉變就是,放棄對因果關系的渴求,而取而代之關註相關關系。也就是說只要知道‘是什麽’,而不需要知道‘為什麽’。”
頗有些戲謔的是,“大數據”在中國證券市場上的應用,並不是在投資交易領域的應用,而是以“捕鼠”為開端,博時基金的馬樂第壹個被“捕鼠神器”逮住。
交易所在掌握了“大數據”利器後,意味著海量的交易數據被持續的跟蹤和分析,用以發現“相關關系”。那麽,基金經理“老鼠倉”時代是否就此宣告終結?
至少可以確定的是,以往案例中傳統的、明目張膽的老鼠倉行為將在大數據面前無所遁形,並且會很快被偵測出來,這將大大提高老鼠倉的操作難度,減少老鼠倉行為的發生。但就此斷言大數據將終結壹切老鼠倉,亦為時尚早。
解密交易所“大數據”
壹般而言,“大數據”是指不用隨機分析法(抽樣調查)這樣的捷徑,而采用“所有數據”的方法,對海量數據進行分析。“大數據”具有“4V”特點:Volume(大量)、Velocity(高速)、Variety(多樣)、Value(價值)。
據悉,滬深交易所的大數據監測系統從建立到完善,已經有幾年的時間。即在國內“大數據”概念還不太為人所知的時候,交易所已經走在前列,從國外引進了大數據技術。但由於這樣的監測系統並不對外開放,所以在“馬樂案”前,業界知之甚少。
即使到目前,交易所掌握的大數據工具,其模型和運作(計算)方式也依然只能被勾畫出壹個輪廓。相關信息顯示,在交易所依法設立的證券交易監控系統中,上交所異動指標分為4大類、72項,敏感信息分為3級***11大類、154項;深交所則建立了9大報警指標體系,合計204個具體項目。
深交所總經理宋麗萍在2013年3月間的壹次公開發言中亦透露,交易所有“幾十人的監控室,設置了200多個指標用於監測估算”,這在相當程度上印證了上述監控系統參數設置的真實性。
馬樂是如何“現形”的?
交易所的大數據工具晝夜不知疲倦的對海量交易數據進行分析和比對,這改變了以往發現老鼠倉“現形”的模式——在“前大數據時代”,大部分老鼠倉是通過“舉報”被發現,交易所處於較為被動的角色。但進入“大數據時代”後,交易所則是通過主動的數據挖掘來發現老鼠倉。
馬樂案即是交易所主動挖掘的結果。
深交所監管部門在日常監控時發現壹個10億元賬戶重倉的小盤股和馬樂掌管的“博時精選”高度重合。進壹步追查發現,壹個3000萬的賬戶亦是如此,交易所隨即上報證監會並立案。
有數據分析專家向記者解析,交易所挖掘的數據就是交易數據,因此非常容易采集,這是很適合應用大數據工具的。在數據引用後,就進入“數據索引”或稱“模型搭建”的階段,通常將四個因素,即價格、成交量、時間、空間進行量化分析,整個數據處理過程是自動的,包括“自動關聯、自動聚類、自動分類、自動重排”的快速計算。
具體而言,馬樂“老鼠倉”的操作中,其頻繁進出中小板和創業板個股,很容易被系統監測到與博時精選的“關聯性”,系統也會自動將其賬戶歸類。因此交易所只要進壹步分析這些操作的時間差,就不難將“老鼠倉”抓獲。
而到了這壹階段,交易數據層面的證據也已經相當確鑿,再輔之對賬戶資金來源的調查,“老鼠倉”行為根本沒有任何辯駁的空間。
老鼠倉時代已經終結了嗎?
大數據工具的出現,意味著老鼠倉時代的終結嗎?
從基金經理行為層面分析,老鼠倉此前之所以頻繁發生,很重要的原因在於這種行為本身的違法成本過於低廉,在“低風險、高收益”的情況下,基金經理面臨巨大的誘惑,有足夠的動力進行違法違規行為。而大數據工具的存在,使得“老鼠倉”行為被發現的概率極大提高,導致違法成本巨幅增加,其震懾力不言而喻。
但就此斷言“老鼠倉”時代已經終結,則或許過於絕對。
與真正意義上需要借助於“雲計算”的“大數據”處理不同的是,目前業界所稱的交易所“大數據”是對交易所壹系列監察系統口語化的統稱。有數據分析專家指,從這個層面上來說,交易所“大數據”實際上是壹整套監測模型,其數據架構方式、數據計算比對的邏輯過程等是模型的核心,這套系統對傳統的老鼠倉模式幾乎是可以做到“見血封喉”,但不排除將來出現更“智慧”的違法者,“繞道”系統監測的領域,或者以更復雜的交易模式來躲過系統的監測,也未可知。因此只能說,大數據終結了以往“老鼠倉”的“草莽”時代,再以傳統手法行事已行不通,但“後大數據時代”的貓鼠之戰,或許只是剛剛開始。