壹道數學建模小問題

我國的證券交易盡管起步較晚, 但經過十年的發展, 股票市場已初具規模, 滬深兩個證

券交易所目前已有壹千余家的上市公司, 股票已成為繼儲蓄、債券之後的又壹熱門投資品

種. 綜合指數反映了股票市場的整體走向及內在規律. 本文運用國際著名的大型集成軟件系

統 SA S 中的時間序列和回歸分析方法對我國近三年的上證綜指作了預測分析. 我們分別用

求和自回歸滑動平均(AR IMA ) 方法及逐步自回歸方法, 作了各種參數搭配的試算比較, 最

後確定的二個程序對最近 8 個交易日(2000 年 10 月 23 日～ 2000 年 11 月 1 日) 的收盤指數

的平均絕對預測誤差分別為 01464% 和 01404%.

用

ARIMA

過程對上證綜指的預測

由文獻[1]可知, SA S ETS 軟件中的AR IMA (求和自回歸滑動平均) 過程提供了壹個

綜合工具包來進行壹元時間序列的模型識別、參數估計及預測分析. 基於上海證券交易所

1997 年 10 月 31 日～ 2000 年 10 月 20 日的綜合指數(收盤指數) 數據, 我們用AR IMA 過程

作了模擬和預測. 數學上純AR IMA 模型記作

= ∧+

1 - Η

- … - Η

1 - ?

- … - ?

(1)

其中,

代表交易日期;

表示響應序列

或

的差分; ∧為均值項;

是後移算子; Ε

表示

獨立擾動或稱作隨機誤差.

我們用 1997 年 10 月 31 日～ 2000 年 10 月 20 日的綜合指數作了試算分析, 發現總的擬

合效果較好(見圖 1); 在“識別”階段, 我們用 IDEN T IFY 語句計算發現序列{

}是非平穩

的, 而由自相關系數圖可以看出, 通過壹階差分後的序列是近似平穩的. 結合偏自相關系數

和逆自相關系數圖, 通過反復試算比較, 我們選擇了參數

= 1 和

= 1. 在“估計”階段, 我們

發現本序列用條件最小二乘估計法來算結果要好壹些. 我們用上述模型相應的程序對 2000

Page 2

年 10 月 23 日～ 2000 年 11 月 1 日的指數作了預測, 8 天的平均絕對誤差為 0. 464% , 結果見

表 1.

表

用

ARIM A

方法對最近

個交易日的預測結果

日期

實際值

預測值

絕對預測誤差

(% )

2000 10 23

1958. 93

1951. 45

0. 38184

2000 10 24

1956. 34

1954. 17

0. 11092

2000 10 25

1977. 25

1956. 34

1. 05753

2000 10 26

1967. 67

1958. 28

0. 47721

2000 12 27

1967. 40

1960. 13

0. 36952

2000 10 30

1973. 57

1961. 93

0. 58979

2000 10 31

1961. 28

1963. 72

0. 12441

2000 11 01

1977. 36

1965. 50

0. 59979

另用該程序預測 2000 年 11 月 2 日的收盤指數為 1967. 28.

圖

求和自回歸滑動平均擬合圖

用

FORECAST

過程預測上證綜指

考慮到僅用AR IMA 方法進行預測可能不夠穩定, 我們又基於同樣的數據進壹步采用

SA S ETS 軟件中的 FORECA ST 過程作了預測分析. 由文獻[1]可知, FORECA ST 過程提

供壹種快速而且自動的時間序列預報方法, 它使用外推的預報方法, 所作的預報僅僅是時間

和該序列過去值的函數, 沒有其它變量. 這種方法是把時間趨勢回歸同壹個自回歸模型結

合在壹起, 並用逐步方法來選擇用於自回歸過程的時滯步數. 逐步自回歸模型如下

t- 1

t- 2

+ … +

t- p

+ Ε

(2)

其中

表示時間(本文中代表交易日期) ,

表示相應日期的收盤指數, Ε

是獨立的、均值為

零的隨機誤差.

逐步自回歸方法首先對序列擬合時間趨勢模型, 並計算每個值和估計的趨勢之間的差

值(該過程稱為刪除趨勢) , 然後使用向後逐步選擇參數的方法對趨勢模型的殘差擬合自回

歸過程, 尋找最不顯著的自回歸參數, 如果這個最不顯著參數的顯著水平大於 0105, 則從

期

劉萍等

運用

SA S

軟件系統對上證綜合指數的預測分析

Page 3

模型中刪去該參數, 繼續該過程, 直到只有顯著的自回歸參數被保留下來為止. 因為這個

趨勢和自回歸參數是依次被擬合而不是同時擬合的, 所以參數估計在統計學意義上是漸近

最優的, 且該方法的計算量比較小.

我們用 1997 年 10 月 31 日～ 2000 年 10 月 20 日的數據分別取TREND= 1, 2, 3 作了試

算分析, 也發現總的擬合效果較好, 但取 TREND = 1, 2 時, 對最近幾日的預測偏小, 取

TREND = 3 時預測效果相對較好. 我們用上述參數相應的程序也對 2000 年 10 月 23 日～

2000 年 11 月 1 日的指數作了預測, 8 天的平均絕對誤差為 01404% , 結果見下表.

表

用逐步自回歸方法對最近

個交易日的預測結果

日期

實際值

預測值

絕對預測誤差

(% )

2000 10 23

1958. 93

1951. 65

0. 37163

2000 10 24

1956. 34

1954. 66

0. 08587

2000 10 25

1977. 25

1960. 32

0. 85624

2000 10 26

1967. 67

1965. 81

0. 09453

2000 12 27

1967. 40

1971. 05

0. 18552

2000 10 30

1973. 57

1976. 28

0. 13731

2000 10 31

1961. 28

1981. 49

1. 03045

2000 11 01

1977. 36

1986. 67

0. 47083

另用該程序預測 2000 年 11 月 2 日的收盤指數為 1991. 81.

討論

本文所用的AR IMA 方法和逐步自回歸方法各有優缺點, 前者各類參數較多, 要通過

各種搭配反復試算比較才能確定較好的模型, 但它可處理的數據類型較多; 後者計算量

小、模型較易確定, 但可調節的參數較少, 故其可處理的數據類型比較有限. 從本問題的計

算結果來看, 好象後者的預測精度要好壹些. 我們認為, 在實際使用時, 可綜合考慮二種

方法的預測結果. 如由AR IMA 方法預測 2000 年 11 月 2 日的收盤指數為 1967. 28; 而用

逐步自回歸方法的預測值為 1991. 81, 這兩個數值很接近, 二者平均為 1984. 55. 可以此值

作為 2000 年 11 月 2 日的收盤指數的預測值.

本文所用的 SA S 系統具有完備的數據訪問、管理、分析和呈現功能, 在數據處理與統

計分析領域被譽為國際上的標準軟件. 文中基於 SA S ETS 軟件所作的時間序列分析方便

而且靈活, 並達到了較高的預測精度, 所有的計算在數分鐘內即可完成, 從而便於推廣應

用及進壹步改進模型. 每天新的數據出來後, 只要分別將其加入本文所編寫的二個 SA S 程

序當中(不必修改參數或其它 SA S 語句) , 分別運行這二個程序, 即可自動算出由AR IMA

方法給出的預測值及由逐步自回歸方法給出的預測值, 再結合專家的總體評價即可對下壹

交易日進行預報. 此外, 用 SA S 軟件系統還可以進行中長期預測及多元時間序列分析, 因

而它有著廣泛的應用前景

&client=firefox-a&st_usg=ALhdy28ykKXF4osAsJpKXbRMngivKDF5aA