歲末年初,卷煙企業在安排來年卷煙銷售任務時,對卷煙銷售進行預測是非常必要的。利用ARIMA模型預測卷煙銷售是壹種非常有用的方法。
ARIMA方法是時間序列預測的壹種有效方法。為了提高卷煙銷售預測的準確性,提出了壹種基於ARIMA的卷煙銷售預測模型,實現了月度和季度卷煙銷售預測。通過實證分析,證明該模型能夠很好地預測月度和季度卷煙銷售總量。
壹、理論前提和模型介紹
卷煙銷售在時間序列上具有雙重趨勢變化的特點,即總體趨勢變化和季節波動。雙趨勢預測的特點是觀測值的排列順序的重要性和前後觀測值的相關性及其同期比值,即預測點與相距較近的觀測點相關性強,而與相距較遠的觀測點相關性弱。雙趨勢預測常用的方法有線性回歸、神經網絡、時間序列分析[1]。時間序列分析方法可以根據歷史數據客觀地分析卷煙銷售情況,可以實現卷煙銷售的季節性和周期性預測。傳統的時間序列分析方法,如滑動平均法和指數平滑法,往往會因為滯後誤差而影響預測精度。ARMA模型是描述平穩隨機序列最常用的模型,是目前最好的單變量隨機時間序列預測方法。但是真實的時間序列往往是非平穩的,所以我們經常使用ARIMA模型對時間序列進行分析。
時間序列分析的ARIMA建模方法,又稱Box-Jenkins方法,是以美國統計學家Geogre命名的壹種時間序列預測方法。E.P.Box和英國統計學家Gwilym M.Jenkins .它主要是根據對時間序列的分析,選擇合適的模型進行預測。ARIMA模型也稱為自回歸綜合移動平均模型。Box-Jenkins方法的基本思想是利用時間序列的過去值和現在值的線性組合來預測其未來值。也就是說,時間的推移所形成的數據序列被視為壹個隨機序列,時間序列被視為壹組只依賴於時間t的隨機變量,這組隨機變量的相關性或自相關性表明了被觀察對象發展的連續性。壹旦通過相應的數學模型描述了這種相關性,就可以從過去和現在的值預測時間序列的未來值[2]。
時間序列由長期趨勢、季節變化、周期性波動和不規則變化四部分組成。時間序列是同壹事物或現象在不同時期形成的數據,反映了事物和現象在時間上的發展變化。
ARIMA模型使用大量的歷史數據來建立模型。經過模型辨識和參數估計,確定了壹個能描述所研究時間序列的數學模型。最後由這個模型推導出壹個預測模型,從而達到預測的目的。ARMA模型有三種基本形式:自回歸模型(AR)、移動平均模型(MA)和自回歸移動平均模型(或混合模型)[3]。
1.自回歸模型AR(p)
如果時間序列{yt}滿足:
yt =φ1yt-1+…+φpyt-p+εt(1)。
其中:{εt}是獨立分布的隨機變量序列,且對任意t,E(εt)=0,var(εt)= >;0,稱時間序列{yt}服從P階自回歸模型,記為AR(p)。φ1,…,φp稱為自回歸系數。
設Bk為k步滯後算子,即Bkyt=yt-1,則模型(1)可表示為:
yt=(φ1B+…+φpBP)yt+εt
設φ(B)=1-φ1B-…-φpBP,則模型(1)可表示為:
φ(B)yt=εt
AR(p)平穩的條件是滯後算子多項式φ(B)=1-φ1B-…-φpBP的根都在單位圓外,即φ(B)=0的根大於1。
2.移動平均模型MA(q)
如果時間序列{yt}滿足:
yt =εt–θ1εt-1–…–θqyt-q(2)
則稱時間序列{yt}服從Q階移動平均模型,記為MA(q)。θ1,…,θq稱為移動平均系數。
如果用滯後算子Bk表示,設θ(B)=1-θ1B-…-θqBP,那麽模型(2)可以寫成:
yt=θ(B)εt
MA(q)模型在任何條件下都是平穩的。
3.自回歸移動平均模型ARMA(p,q)
如果時間序列{yt}滿足:
yt =φ1yt-1+…+φpyt-p+εt-–
那麽稱時間序列{yt}服從(p,q)階自回歸移動平均模型,記為ARMA(p,q)。φ1,…,φP稱為自回歸系數,θ1,…,θq稱為移動平均系數。
對於ARMA(p,q)模型,當q=0時,模型為AR(p)模型;當p=0時,模型為MA(q)模型。
如果用滯後算子Bk表示,ARMA(p,q)模型可以寫成:
φ(B)yt=θ(B)εt
2.基於ARIMA模型的卷煙銷售預測框架
1.收集幾年的卷煙銷售數據。
2.數據序列的穩定性。建立ARMA模型的基本前提是保證時間序列的平穩性。ARIMA建模的過程是對非平穩時間序列進行平穩化,然後建立ARMA模型。壹旦確定了模型中的p和q,就可以確定ARIMA模型。因此,首先要做的分析工作是確定p和q的具體值,然後進行ARMA(p,q)模型的參數估計和顯著性檢驗。最後,利用顯著模型對時間序列進行預測。
3.計算自相關和偏相關系數,檢查預處理後的數據是否滿足ARMA建模的要求。
4.4的標識。ARIMA模型。根據自相關系數(AC)和偏相關系數(PAC)的截斷,初步確定序列屬於哪個模型以及模型的階次,並應用AIC準則確定模型的階次。
5.參數估計後,檢驗ARIMA模型的適用性,即用白噪聲檢驗模型的殘差序列。如果失敗,模型必須重新排序。
6.用ARIMA模型預測月度卷煙銷量,對煙草公司月度和季度卷煙銷量有指導作用。
3.某煙草公司卷煙銷售模式分析
1.組織數據。
本文使用的數據是某煙草公司近四年的卷煙銷量,如表1所示。
表1歷史卷煙銷售數據
圖1卷煙銷售曲線
從圖1可以清楚地看出,卷煙銷售數據具有總體平衡和季節波動的特點,在時間序列上具有雙重趨勢變化的特點。
2.數據序列穩定化
從圖1可以看出,數據序列是有趨勢的,是非平穩序列,需要穩定。數據壹階差分後的序列圖如圖2所示。
圖2壹階差分後的序列圖
圖2顯示趨勢已經消除,但它仍然是季節性的,所以進行季節性差異,如圖3所示。
圖3。季節差異後的序列圖
3.計算自相關和偏相關系數,檢查預處理後的數據是否滿足ARMA建模的要求。
序列經過壹階差分和季節差分後的相關系數和偏相關系數如圖4所示。
圖4。季節差異序列的相關系數和偏相關系數。
從上圖可以看出,時間序列的自相關系數基本落入置信區間,並逐漸趨於零。可以判斷時間序列是穩定的。
4.4 .辨識、參數估計和檢驗。ARMA模型:
這個順序是由AIC原理決定的。AIC準則被稱為最小信息辨識模型階準則。該準則的基本思想是根據模型的預測誤差來判斷自回歸模型的階數是否合適。如果從某個序列擬合出壹個適用的自回歸模型,那麽用這個模型對該序列進行壹步預測得到的預測誤差壹定是最小的。最優模型為logARIMA (0,1,2) (0,1,1) snoint。
模型LOGARIMA (0,1,2) (0,1,1) SNOINT的剩余項的ACF、PACF和IACF圖如下:
圖5模型LOGARIMA (0,1,2) (0,1,1) SNOINT的剩余項的ACF,PACF,IACF圖。
參數估計和模型擬合後,要檢驗ARIMA模型的適用性,即用白噪聲檢驗模型的殘差序列。如果殘差序列不是白噪聲序列,說明殘差序列中還有有用的信息沒有被提取出來,需要重新辨識模型。
圖6 LOGARIMA(0,1,2) (0,1,1) SNOINT模型殘差項的白噪聲和單位根檢驗圖。
從上圖可以看出,模型的殘差項是白噪聲,信息提取充分。
模型擬合統計如下:
圖7模型LOGARIMA (0,1,2) (0,1,1) SNOINT擬合統計
模型的統計參數如下:
圖8 logARIMA(0,1,2) (0,1,1) snoint模型的統計參數。
5.用ARIMA模型預測165438+2009年10月-65438+2000年2月的銷售數據。
165438+2009年10月-2010 65438+2009年2月銷售趨勢預測圖如下:
圖9 165438+2009年10月-10+2009年2月銷售預測圖。
2009年165438+10月-2010 65438+2月銷量預測及預測區間如下。
綜上所述,ARIMA法建立的卷煙銷售預測模型能夠較好地預測各規格卷煙月銷售總額的變化趨勢,能夠有效模擬卷煙銷售的季節性、周期性和隨機性特征。預測的數據可以作為月度和季度卷煙銷售的參考。
[參考文獻]
[1]羅,,呂永貴,,基於ARMA的混合卷煙銷售預測模型,計算機應用研究[J].2009.7
[2]阮靜,SAS統計分析從入門到熟練[M],人民郵電出版社. 2009
[3]徐國強,統計預測與決策[M],上海財經大學出版社. 2008