關鍵詞 馬爾可夫鏈模型 滬深300指數 日收益率概率分布 平穩分布
1 引言
滬深300指數於2005年4月正式發布,其成份股為市場中市場代表性好,流動性高,交易活躍的主流投資股票,能夠反映市場主流投資的收益情況。眾多證券投資基金以滬深300指數為業績基準,因此對滬深300指數收益情況研究顯得尤為重要,可為投資管理提供參考。
取滬深300指數交易日收盤價計算日收益率,可按區間將日收益率分為不同的狀態,則日收益率時間序列可視為狀態的變化序列,從而可以嘗試采用馬爾可夫鏈模型進行處理。馬爾可夫鏈模型在證券市場的應用已取得了不少成果。參考文獻[1]、[2]、[3]和[4]的研究比較類似,均以上證綜合指數的日收盤價為對象,按漲、平和跌劃分狀態,取得了壹定的成果。但只取了40~45個交易日的數據進行分析,歷史數據過少且狀態劃分較為粗糙。參考文獻[5]和[6]以上證綜合指數周價格為對象,考察指數在的所定義區間(狀態)的概率,然其狀態偏少(分別只有6個和5個狀態),區間跨度較大,所得結果實際參考價值有限。參考文獻[7]對單只股票按股票價格劃分狀態,也取得了壹定成果。
然而收益率是證券市場研究得更多的對象。本文以滬深300指數日收益率為對考察對象進行深入研究,采用matlab7.1作為計算工具,對較多狀態和歷史數據進行了處理,得出了滬深300指數日收益率概率分布,並對日收益率的變化進行了預測。
2 馬爾可夫鏈模型方法
2.1 馬爾可夫鏈的定義
設有隨機過程{Xt,t∈T},T是離散的時間集合,即T={0,1,2,L},其相應Xt可能取值的全體組成狀態空間是離散的狀態集I={i0,i1,i2,L},若對於任意的整數t∈T和任意的i0,i1,L,it+1∈I,條件概率則稱{Xt,t∈T}為馬爾可夫鏈,簡稱馬氏鏈。馬爾可夫鏈的馬氏性的數學表達式如下:
P{Xn+1=in+1|X0=i0,X1=i1,L,Xn=in}=P{Xn+1=in+1|Xn=in} (1)
2.2 系統狀態概率矩陣估計
馬爾可夫鏈模型方法的基本內容之壹是系統狀態的轉移概率矩陣估算。估算系統狀態的概率轉移矩陣壹般有主觀概率法和統計估算法兩種方法。主觀概率法壹般是在缺乏歷史統計資料或資料不全的情況下使用。本文采用統計估算法,其主要過程如下:假定系統有m種狀態S1,S2,L,Sm根據系統的狀態轉移的歷史記錄,可得到表1的統計表格。其中nij表示在考察的歷史數據範圍內系統由狀態i壹步轉移到狀態j的次數,以■ij表示系統由狀態i壹步轉移到狀態的轉移概率估計量,則由表1的歷史統計數據得到■ij的估計值和狀態的轉移概率矩陣P如下:
■ij=nij■nik,P=p11 K p1mM O Mpm1 L pmn(2)
2.3 馬氏性檢驗
隨機過程{Xt,t∈T}是否為馬爾可夫鏈關鍵是檢驗其馬氏性,可采用χ2統計量來檢驗。其步驟如下:(nij)m×m的第j列之和除以各行各列的總和所得到的值記為■.j,即:
■.j=■nij■■nik,且■ij=nij■nik(3)
當m較大時,統計量服從自由度為(m-1)2的χ2分布。選定置信度α,查表得χ2α((m-1)2),如果■2>χ2α((m-1)2),則可認為{Xt,t∈T}符合馬氏性,否則認為不是馬爾可夫鏈。
■2=2■■nijlog■ij■.j(4)
2.4 馬爾可夫鏈性質
定義了狀態空間和狀態的轉移概率矩陣P,也就構建了馬爾可夫鏈模型。記Pt(0)為初始概率向量,PT(n)為馬爾可夫鏈時刻的絕對概率向量,P(n)為馬爾可夫鏈的n步轉移概率矩陣,則有如下定理:
P(n)=PnPT(n)=PT(0)P(n)(5)
可對馬爾可夫鏈的狀態進行分類和狀態空間分解,從而考察該馬爾可夫鏈模型的不可約閉集、周期性和遍歷性。馬爾可夫鏈的平穩分布有定理不可約、非周期馬爾可夫鏈是正常返的充要條件是存在平穩分布;有限狀態的不可約、非周期馬爾可夫鏈必定存在平穩過程。
3 馬爾可夫鏈模型方法應用
3.1 觀測值的描述和狀態劃分
取滬深300指數從2005年1月4日~2007年4月20日***555個交易日收盤價計算日收益率(未考慮分紅),將日收益率乘以100並記為Ri,仍稱為日收益率。計算公式為:
Ri=(Pi-Pi-1)×100/Pi-1(6)
其中,Pi為日收盤價。
滬深300指數運行比較平穩,在考察的歷史數據範圍內日收益率有98.38%在[-4.5,4.5]。可將此範圍按0.5的間距分為18個區間,將小於-4.5和大於4.5各記1區間,***得到20個區間。根據日收益率所在區間劃分為各個狀態空間,即可得20個狀態(見表2)。
3.2 馬氏性檢驗
采用χ2統計量檢驗隨機過程{Xt,t∈T}是否具有馬氏性。用前述統計估算法得到頻率矩陣(nij)20×20。
由(3)式和(4)式可得:■.j=■nij■■nik,且■ij=nij■nik,■2=2■■nijlog■ij■.j=446.96,令自由度為k=(m-1)2即k=361,取置信度α=0.01。由於k>45,χ2α(k)不能直接查表獲得,當k充分大時,有:
χ2α(k)≈■(zα+■)2(7)
其中,zα是標準正態分布的上α分位點。查表得z0.01=2.325,故可由(1)、(7)式得,即統計量,隨機過程{Xt,t∈T}符合馬氏性,所得模型是馬爾可夫鏈模型。
3.3 計算轉移概率矩陣及狀態壹步轉移
由頻率矩陣(nij)20×20和(1)、(2)式得轉移概率矩陣為P=(Pij)20×20。考察2007年4月20日分時交易數據(9:30~15:30***241個數據),按前述狀態劃分方法將分時交易數據收益率歸於各狀態,並記Ci為屬於狀態i的個數,初始概率向量PT(0)=(p1,p2,L,pt,L,p20),則:
pj=Cj/241,j=1,2,K,20(8)
下壹交易日日收益率分布概率PT(0)={p1(1),p2(1),L,pi(1),L,p20(1)},且有PT(1)-PT(0)p,計算結果如表3所示。
3.4 馬爾可夫鏈遍歷性和平穩分布
可以分析該馬爾可夫鏈的不可約集和周期性,從而進壹步考察其平穩分布,然而其分析和求解非常復雜。本文使用matlab7.1采用如下算法進行求解:將壹步轉移概率矩陣P做乘冪運算,當時Pn+1=Pn停止,若n>5 000亦停止運算,返回Pn和n。計算發現當n=48時達到穩定,即有P(∞)=P(48)=P48。考察矩陣P(48)易知:各行數據都相等,不存在數值為0的行和列,且任意壹行的行和為1。故該馬爾可夫鏈{Xt,t∈T}只有壹個不可約集,具有遍歷性,且存在平穩分布{πj,j∈I},平穩分布為P(48)任意壹行。從以上計算和分析亦可知該馬爾可夫鏈是不可約、非周期的馬爾可夫鏈,存在平穩分布。計算所得平穩分布如表4所示。
3.5 計算結果分析
表3、表4給出了由當日收益率統計出的初始概率向量PT(0),狀態壹步預測所得絕對概率向量PT(1)和日收益率平穩分布,由表3和表4綜合可得圖1。可以看出,雖然當日(2007年4月20日)收益率在區間(1.5,4.5)波動且在(2.5,4.5)內的概率達到了0.7261,表明在2007年4月20日,日收益率較高(實際收盤時,日收益率為4.41),但其下壹交易日和從長遠來看其日收益率概率分布依然可能在每個區間。這是顯然的,因為日收益率是隨機波動的。
對下壹交易日收益率預測(PT(1)),發現在下壹交易日收益率小於0的概率為0.4729,大於0的概率為0.5271,即下壹交易日收益率大於0的概率相對較高,其中在區間(-2,-1.5)、(0.5,1)和(1,1.5)概率0.2675、0.161和0.1091依次排前三位,也說明下壹交易日收益率在(-2,-1.5)的概率會比較高,有壹定的風險。
從日收益率長遠情況(平穩分布)來看,其分布類似正態分布但有正的偏度,說明其極具投資潛力。日收益率小於0的概率為0.4107,大於0的概率為0.5893,即日收益率大於0的概率相當的高於其小於0的概率。
4 結語
采用馬爾可夫鏈模型方法可以依據某壹交易日收益率情況向對下壹交易日進行預測,也可得到從長遠來看其日收益率的概率分布,定量描述了日收益率。通過對滬深300指數日收益率分析和計算,求得滬深300指數日收益率的概率分布,發現滬深300指數日收益率大於0的概率相對較大(從長遠看,達到了0.5893,若考慮分紅此概率還會變大),長期看來滬深300指數表現樂觀。若以滬深300指數構建指數基金再加以調整,可望獲得較好的回報。
筆者亦采用範圍(-5,5)、狀態區間間距為1和範圍(-6,6)、狀態區間間距為2進行運算,其所得結果類似。當采用更大的範圍(如-10,10等)和不同的區間大小進行運算,計算發現若狀態劃分過多,所得模型不易通過馬氏性檢驗,如何更合理的劃分狀態使得到的結果更精確是下壹步的研究之壹。在後續的工作中,采用ANN考察所得的日收益率預測和實際日收益率的關系也是重要的研究內容。馬爾可夫鏈模型方法也可對上證指數和深證成指數進行類似分析。
參考文獻
1 關麗娟,趙鳴.滬綜指走勢的馬爾可夫鏈模型預測[J].山東行政學院,山東省經濟管理幹部學院學報,2005(4)
2 陳奕余.基於馬爾可夫鏈模型的我國股票指數研究[J].商場現代化(學術研討),2005(2)
3 肖澤磊,盧悉早.基於馬爾可夫鏈系統的上證指數探討[J].科技創業月刊,2005(9)
4 邊廷亮,張潔.運用馬爾可夫鏈模型預測滬綜合指數[J].統計與決策,2004(6)
5 侯永建,周浩.證券市場的隨機過程方法預測[J].商業研究,2003(2)
6 王新蕾.股指馬氏性的檢驗和預測[J].統計與決策,2005(8)
7 張宇山,廖芹.馬爾可夫鏈在股市分析中的若幹應用[J].華南理工大學學報(自然科學版),2003(7)
8 馮文權.經濟預測與決策技術[M].武漢:武漢大學出版社,2002
9 劉次華.隨機過程[M].武漢:華中科技大學出版社,2001
10 盛千聚.概率論與數理統計[M].北京:高等教育出版社.1989轉