當前位置:股票大全官網 - 資訊咨詢 - 什麽是擬合指數?

什麽是擬合指數?

擬合指數模擬指數/擬合指數/壹致指數

擬合是計量經濟學的研究領域。所謂擬合指數,簡單來說就是所選變量與被解釋變量的相關性。

股票\基金擬合指數:

指數基金是壹種擬合目標指數,跟蹤目標指數變化,實現與市場同步增長的基金品種。指數基金的投資采用擬合目標指數收益率的投資策略,以多元化的方式投資於目標指數的成份股,使股票組合收益率擬合目標指數所代表的資本市場平均收益率。

操作簡單,透明度高。

從理論上講,指數基金的操作方法很簡單,只要妳根據指數中每種證券的比例買入相應比例的證券並長期持有。

其次,指數基金便宜。由於指數基金采用持有策略,不需要頻繁換股,交易成本遠低於主動管理型基金。

此外,指數基金的表現透明度很高。投資者看到指數基金跟蹤的目標基準指數漲了,就知道自己的指數基金今天凈值能漲多少了。所以很多看得清大勢,看不清個股的機構投資者和部分個人投資者,更傾向於投資指數基金,沒必要有“賺了指數不賺錢”的擔心。

有效規避非系統性風險

與其他基金相比,指數基金的優勢在於可以有效規避非系統性風險,因此指數基金廣泛分散投資,任何壹只股票的波動都不會影響指數基金的整體表現,從而分散風險。另壹方面,由於指數基金所盯住的指數壹般都有較長的跟蹤歷史,因此指數基金的風險在壹定程度上是可以預測的。

因此,長期來看,指數基金的投資業績優於其他基金。2006年,市場上指數基金以125.87%的年均累計凈值增長率成為最賺錢的基金品種。這類基金不會在某些證券或行業投入太多資金。壹般會保持全額投資,沒有市場炒作。

關鍵因素擬合指數投資法的實證研究

指數化投資(Indexing investment)是壹種試圖完全復制某壹證券價格指數或根據編制證券價格指數的原理構建投資組合的證券投資。以這種方式投資的基金稱為指數基金,其收益水平目標是標的指數的變動幅度。自20世紀90年代以來,美國華爾街大多數股票基金經理的業績都低於同期大盤指數。這樣,以復制市場指數走勢為核心思想的指數基金在全球範圍內迅速發展,對證券投資的傳統思維形成了巨大的沖擊和挑戰。在美國,指數基金越來越受歡迎,因為其回報超過同類基金的65~80%。在流入同壹基金市場的新增資金中,流入指數基金的比例從1994的2%上升到1999的31%。1999年末,美國指數基金總額達到3380億美元,占美國股票基金總額的8.37%。美國最大的指數基金和最大的* * *共同基金Vanguards S & amp;P 500管理6543.8+005億美元。

指數化投資在中國的出現比較晚,主要是因為中國的證券市場還比較年輕,還在探索和發展中。中國的投資者群體還不成熟,缺乏科學的投資理念,對市場行為的監管還不完善。莊家炒作等非市場行為對股指影響很大。由於這些原因的影響,中國的股票指數經常偏離市場,不能反映市場的真實情況。

就指數化投資方法而言,市場上常見的方法是完全復制某壹證券價格指數,或者根據編制證券價格指數的原理構建投資組合。這種傳統的指數化投資方式比較被動,在市場正常運行時可以起到很好的作用,但當壹些樣本股上漲或下跌異常快時,就會失去進壹步獲利的機會,及時止損。為了彌補這壹不足,各種替代方法應運而生。

Francesco Corielli和Massimiliano Marcellino(2002)認為跟蹤指數是指數的復制品,包含的股票遠少於指數,跟蹤誤差不包含非經常性成分。他們采用動態因子提取法建立指數替代投資組合,並用蒙特卡洛經驗指數和歐元STOXX50指數進行了驗證。驗證結果令人鼓舞,備選組合基本完成跟蹤曲線[7]。吳崇峰(2000)對上證30指數從1998年7月8日到1999年3月29日的樣本股進行了分析,得出了上證30指數被6只股票的組合所替代的結論[6]。

從以上研究中我們發現,指數化投資法並不壹定要按照證券價格指數的編制原理來構建投資組合,而是可以通過構建備選投資組合來跟蹤指數。在此基礎上,作者提出了關鍵因素擬合指數化投資法,認為股票指數是按照編制股票價格指數的原理,由其樣本股組成的,其走勢反映了這些樣本股的* * *交互作用,但並不是每個樣本股對指數的貢獻都是相同的。股指中有關鍵因素,這些關鍵因素對股指的影響體現在它們所代表的樣本股的表現上。同樣,不是每個關鍵因素對它的貢獻都是壹樣的。關鍵因素中有最具代表性的關鍵樣本股,正是這些最具代表性的關鍵樣本股對股指起著決定性的作用。只要抓住了他們,就抓住了股指。換句話說,只要我們投資這些關鍵因素的組合,我們就會投資股指。此外,同壹關鍵因子中具有代表性的關鍵樣本股可以替換,可以在不影響投資組合指數化的情況下,使股指投資更加靈活,在壹定程度上彌補了傳統方法的不足。

接下來我們將以上證50指數為研究對象,對關鍵因素指數化投資方法進行實證研究。論文結構如下:首先進行研究設計,確定研究程序、模型、樣本和數據;然後,對數據進行因子分析,提取上證50指數的關鍵因子。在此基礎上,我們將根據關鍵因素構建的投資組合與實際上證50指數進行相關性檢驗和回歸分析,對該方法進行驗證。最後得出結論。

研究設計

壹、研究項目和模型設計

第壹步,找出影響上證50指數走勢的關鍵因素。

基於上證50指數成份股的日收益率,我們進行了因子分析,提取了n * * *個反映上證50指數走勢的相同因子,代表了影響上證50指數走勢的n個關鍵因素。多因素模型的構建如下:

index 50 = a 1 * f 1+A2 * F2+……+An * Fn+ε

其中:Index50為上證50指數;Fn是第n個* * *余因子;An是第n * * *個同因子對上證50指數的貢獻率;ε是殘差。

找出這N個關鍵因素後,再進壹步找出這N個關鍵* * *相同因素所代表的樣本股。對應關系如下:

F1~a1(股票11)+a2(股票12)+……

F2~b1(股票21)+b2(股票22)+……

…………………………………

fn ~ n 1(stock n 1)+N2(stock N2)+……

其中:Fn是第n個* * *余因子;股票是同壹因子代表的樣本股;甲,乙...n是樣本股對同壹要素的貢獻率,即要素負荷。

通過觀察同壹個因子的因子負荷,可以分析判斷每個同壹個因子所反映的關鍵因子,並做出相應的解釋。

第二步,證明我們找到的N個關鍵因素是否真的能反映上證50指數的走勢。我們用最具代表性的樣本股構建投資組合Portfolio50,並與上證50指數50進行比較,驗證Portfolio50是否等價於指數50。

為此,我們找出這n個關鍵因素中最具代表性的I個樣本股,按照其方差貢獻占總方差的比例作為權重來構造投資組合,如下:

組合50 = w 1 *股票1+w2 *股票2+……+wi *股票1

其中:Portfolio50是構建的投資組合的日收益率;STOCKi是參與構建投資組合的第I只最具代表性的樣本股的日收益率;Wi是第壹個樣品股票的重量。

計算投資組合50的日收益率和上證50指數50的日收益率。通過相關性檢驗後,對Portfolio50和Index50進行線性回歸分析。回歸模型的構建如下:

Portfolio50=a+b*(Index50)+ε

其中:Portfolio50是構建的投資組合的日收益率;Index50是上證50指數的日收益率;a是常數項;b是回歸系數;ε是殘差。

如果模型得到驗證,A趨近於0,B趨近於1,那麽Portfolio50≈Index50,即Portfolio50等價於Index50,說明我們找到的關鍵因素能夠真實反映上證50指數的走勢,Portfolio50可以代替上證50指數進行指數化投資。

二、模型變量計算

上證50指數成份股每日收益率以相對收益率計算。在配股、送股和現金分紅的情況下,按以下公式計算:

其中:rit為I類股票的T日收益率;Pt和Pt-1分別是T和t-1上的收盤價;c是基於t-1的T日每股現金分紅;As是以t-1日的每股配股比例為基準;s是t-1上的每股對應價格;Ad是t-1上每股送股的比例。

上證50指數的日收益率指數50也是用相對收益率計算的,公式如下:

其中:Rt為上證50指數T日收益率;Pt和Pt-1分別是上證50指數T日和t-1日的收盤價。

第三,研究樣本選擇

本研究所需的上證50指數收盤價、成份股收盤價、現金分紅等原始交易數據來源於上海萬國股市評估咨詢有限公司制作的“大智慧證券信息平臺V5.00”

在因子分析過程中,樣本數據期為2002年2月3日至2004年3月3日,每只樣本股票包含309條數據記錄。因各種原因臨時中止造成的缺失值,采用相鄰數據平均法填補。

考慮到部分新上市公司樣本股上市日期過短,樣本數據數量不充分,業績容易出現異常波動,公司各方面運行機制不夠完善,為防止少數數據幹擾檢驗,排除樣本股,在關鍵因素確立後,根據專業知識分別判斷其屬性。剔除5只樣本股,分別是:白雲機場(600004)、華夏銀行(600015)、南方航空(600029)、中信證券(600030)、長江電力(600900)。

綜上,因子分析樣本股共包含45只上證50指數樣本股,每只包含309條日收益記錄。有309組,13905條日退記錄。

在相關性檢驗和回歸分析過程中,上證50指數自2004年6月2日正式發布,指數代碼為000016,基準日為2003年6月365438+2月0日。到目前為止,數據量太少,不能直接用它來計算。但為了上證50的順利推出,上交所從65438+2003年10月2日發布了上證50板塊概念指數993265。其編制方法和走勢與上證50基本相同,只是采用的基數不同。這裏我們用上證50概念指數993265的數據代替上證50指數000016的數據進行計算。計算時間跨度為2003年7月22日至2004年3月12日。同樣,缺失值的處理方法采用相鄰數據平均填充的方法,* * *統計155組數據。

因素分析

表1 KMO統計量和巴特利特球面檢驗表

凱澤-邁耶-奧爾金抽樣充分性度量。.958

巴特利特球形度試驗約。卡方檢驗9857.426

df 990

簽名。.000

首先,我們使用KMO統計量和Bartlett的球面檢驗來確定樣本數據是否滿足因子分析的前提條件。可以看出,表中檢驗變量間偏相關的KMO統計量為0.958,接近1,說明變量間的相關程度沒有太大差異,數據非常適合進行因子分析。同時,Bartlett的球面假設檢驗的結果也是被拒絕的,它很強地識別了變量之間的相關性,說明樣本股的日收益率之間存在* * *相同的信息,滿足提取* * *相同因子的前提條件。見表1。

本文采用的因子提取方法是主成分分析法。考慮到* * *恒等因子的可解釋性,在提取因子的過程中采用正交旋轉,具體旋轉方法為方差最大化正交旋轉。按照提取的主成分* * *累計貢獻率在85%以上的標準,從壹個* * *中提取20個* * *相同的因子。信息提取充分性測試表(略)告訴我們,根據上訴* * *同因子提取標準,樣本股的信息提取基本充分。

表2 ***用同壹因素解釋的差異百分比表

因子f 1 F2 F3 F4 F5 F6 F7 F8 F9 f 10

方差百分比42.311 6.849 4.540 3.208 2.395 2.856 2.367 2.133 2.035 1.844

累計% 42.311 49.160 53.700 56.908 59.764 62.158 64.525 66.658 68.693 70.537

因子f 11 f 12 f 13 f 14 f 15 f 16 f 17 f 18 f 19 F20

方差百分比1.728 1.674 1.553 1.491.410 1.324 1.286 1.261.261.201

累計% 72.265 73.939 75.491 76.982 78.392 79.716 81.002 82.263 83.464 84.618

我們以同壹因子解釋的方差百分比(表2)作為因子對指數貢獻的權重,對應的多因子模型如下:

index 50 = 0.4231 * f 1+0.0685 * F2+0.0454 * F3+0.0321 * F4+0.0286 * F5+0.0239 * F6+0.0237 * F7+0.0213 * F8+0.0204 * F9+0.0184 * f 654

經過方差最大的正交旋轉,提出因子與變量之間因子負荷大於0.4的變量,然後根據同壹樣本股對同壹因子的貢獻取壹個相對較大的值。我們得到下面的20只樣本股的列表,主要用同壹個因子表示,如表3所示。

表4 ***同壹因子代表的樣本股列表

F1 600028中國石化F5 600664哈藥集團

600808馬鋼股份600038哈飛股份

600688上海石化F6 600839四川長虹

600019寶山鋼鐵600033福建高速公路

600026中海發展600008股本

600569安鋼F7 600591上航

600050中國聯通600221海南航空

600036招商銀行F8 600795國電電力

600350山東基建600011華能國際

600649原水股份600642深能股份

600000浦發銀行F9 600643愛建股份

F2 600602廣電電子F10 600887伊利股票

600832東方明珠600597光明乳業

600637廣電資訊F11 600016民生銀行

600100清華同方F12 600811東方集團

600171上海貝嶺F13 600652艾石股份

600601方正科技F14 600006東風汽車

F3 600609金杯汽車F15 600812華北制藥

600805大嶽投資F16 600705北亞集團

600104上海汽車F17 600895張江高科

F4 600717天津港F18 600863內蒙古華電

600018上海港集裝箱F19 600098廣州控股

600009上海機場F20 -

每個* * *相同因子與樣本股因子負荷的對應關系如下:

f 1 ~ 0.84(600028)+0.84(600808)+0.83(600688)+0.82(600019)+0.65(600026)+0.61(600569)+0.61(600050)+0.55(60000

F2 ~ 0.88(600602)+0.86(600832)+0.85(600637)+0.78(600100)+0.69(600171)+0.49(600601)

F3 ~ 0.81(600609)+0.75(600805)+0.63(600104)

F4 ~ 0.76(600717)+0.67(600018)+0.46(600009)

F5~0.88(600664)+0.85(600038)

F6 ~ 0.66(600839)+0.49(600033)+0.46(600008)

F7 ~ 0.72(600591)+0.67(600221)

F8 ~ 0.56(600795)+0.55(600011)+0.52(600642)

F9~0.83(600643)

f 10 ~ 0.75(600887)+0.40(600597)

f 11 ~ 0.80(600016)

f 12 ~ 0.81(600811)

F13~0.81(600652)

F14~0.97(600006)

F15~0.80(600812)

F16~0.77(600705)

F17~0.78(600895)

F18~0.75(600863)

F19~0.52(600098)

F20~ -

觀察* * *同因子代表的樣本股列表與因子負荷的對應關系,可以分析判斷每個* * *同因子所反映的關鍵因子如下:

F1對應的樣本股有:600028中國石化、600808馬鋼股份、600688上海石化、600019寶鋼股份、600026中海發展、600569安陽鋼鐵、600050中國聯通、600036招商銀行、600350山東基建等。這些都是知名的大盤藍籌股,經營業績優秀,凈資產收益率高,包括幾只銀行股,可以說是大盤中的大盤股,藍籌中的藍籌股。我們可以將因子F1定義為“大盤深藍股”。

F2對應的樣本股有:600602廣電電子、600832東方明珠、600637廣電信息、600100清華同方、600171上海貝嶺、600601方正科技。這些股票是高科技行業的傑出代表,主要從事計算機。

F3對應的樣本股有:600609金杯汽車、600805大嶽投資、600104上海汽車,屬於典型的汽車股。隨著近幾年汽車行業的崛起,業績呈現穩定增長,我們可以將因子F3定義為“汽車藍籌”。

與F4對應的樣本股有:600717天津港、60018上海港集裝箱、600009上海機場,與陸、海、空港口物流運輸密切相關。我們可以將F4因素定義為“港口物流股”。

F5對應的樣本股有:600664哈藥集團、600038哈飛股份,地域色彩明顯,觸摸到東北老工業基地發展的脈搏。我們可以將因素F5定義為“東北老工業股”。

F6對應的樣本股為:600839四川長虹、600033福建高速、600008股本,其中600033福建高速、600008股本主要從事公益事業和基礎設施。我們可以將F6因子定義為“基本公益股”。但600839四川長虹主營業務為電視機、空調等家電,業績突出。被劃入這壹類,可以看作是統計以外的原因造成的例外。

對應F7的樣本股有:600591上航,600221海航,兩只國內航空運輸行業的優質股票。我們可以將F7因子定義為“航空運輸股”。

F8對應的樣本股有:600795國電電力,600011華能國際,600642深能股份,明顯代表電能。我們可以將因子F8定義為“電能份額”。

F9對應的樣本股為:600643愛建,為滬市50只成份股中的非銀金融股。我們可以將因子F9定義為“非銀行金融股”。

F10對應的樣本股為:600887伊利、600597光明乳業,均為乳制品龍頭。乳制品的消費與普通人的日常生活息息相關,其表現也從壹定角度反映了普通人生活的富裕程度。我們可以將因子F10定義為“乳制品消費股”。

F11對應的樣本股有:600016民生銀行,銀行股。F12對應的樣本股為:600811東方集團,綜合性股票,涉足金融、電商、建材、通信等領域。F13對應的樣本股為:600652愛石股份,主營計算機硬件和網絡設備。F14對應的樣本股有:600006東風汽車,汽車行業股。F15對應的樣本股為:600812華北制藥,醫藥化工產品生產和銷售。F16對應的樣本股為:600705北亞集團,主營運輸、物流、貿易。F17對應的樣本股有:600895張江高科,地產股。F18對應的樣本股為:600863內蒙古華電,主營動態發電和供熱。F19對應的樣本股為:600098廣州控股,從事能源、物流、基建等綜合性股票。這些因素所代表的股票具有很強的針對性。雖然有些股票可以歸因於上述因素,但從統計的角度來看,它們應該單獨列出,以確保原始信息的完整反映。F20對應的樣本股的因子負荷都小於0.4,說明其可解釋性很小,反映的樣本股比較分散,從專業角度沒有分析價值,所以排除。

至於白雲機場(600004)、華夏銀行(600015)、南方航空(600029)、中信證券(600030)、長江電力(600900)這5只因上市時間較短而被否的股票,可以用我們的專業知識進行分類,在以後的分析中進行驗證。白雲機場(600004)主營機場物流,可歸為F4;華夏銀行(600015)是銀行股,可歸類為f 11;南航(600029)主營航空運輸,可歸為F7;中信證券(600030)為非銀金融股,可歸為F9,長江電力(600900)主營電力能源,可歸為F8。

綜上所述,通過對上證50指數成份股日收益率數據的因子分析,我們從F1到F19中提取出了具有實際意義的19 * * *相同因子,它們代表了影響上證50指數走勢的19關鍵因子。多因素模型的構建如下:

index 50 = 0.4231 * f 1+0.0685 * F2+0.0454 * F3+0.0321 * F4+0.0286 * F5+0.0239 * F6+0.0237 * F7+0.0213 * F8+0.0204 * F9+0.0184 * f 654

相關檢驗和回歸分析

我們將從因子分析中提取的19只具有代表性的樣本股組合起來構建投資組合Portfolio50,每只樣本股的權重等於累計百分比中每個* * *因子所解釋的方差的百分比。例如,因子F1的權重等於(42.311/83.464 = 0.5069)。考慮到F1因子代表的股票數量較多,權重比例較大,選取前四只股票,每只股票的權重為F1因子權重的四分之壹,共有22只樣本股。

投資組合的構成如下:

portfolio 50 = 0.1267 *(600028)+(600808)+(600688)+(600019))+0.0821 *(600602)+0.0544 *(600609)+0.0384 *(600717)+0.0342

Portfolio50與Index50的相關性檢驗表(略)顯示,在0.01的置信水平下,Portfolio50與Index50的相關系數為0.943,說明Portfolio50與Index50高度相關。

表4回歸模型和測試結果表

模型平方和。

1回歸0 . 025 1 . 025 1238 . 863 . 000

殘差. 003 153 .000

總計. 028 154

表5回歸系數和檢驗結果表

模型非標準化系數標準化系數。相關

b標準。誤差β零階部分

1(常數)7.235E-04 .000 2.004 .047

index 50 1 . 021 . 029 . 943 35 . 197 . 000 . 943 . 943。

從回歸模型和檢驗結果(表4)可以看出,回歸模型具有明顯的統計意義。從回歸系數和檢驗結果(表5)可以看出,回歸模型的系數b具有明顯的統計意義,b的值為1.021。雖然常數項的檢驗沒有統計學意義,但是無關緊要。對於常識,我們通常把它保留在方程中,取值為0.0007235。

基於此,我們可以建立如下回歸模型:

組合50 = 0.0007235+1.021 *(指數50)

其中:常數項a=0.0007235,非常接近0,回歸系數b=1.021,也接近1。所以我們可以認為Portfolio50≈Index50。

最後,我們對回歸模型擬合的有效性進行評估和分析(流程略)。從擬合模型的擬合優度簡報和德賓-沃森統計量可知,確定系數R2為0.89,調整後的確定系數R2為0.889,說明模型的擬合效果顯著。德賓-沃森統計量是1.786,數值在2左右。可以看出殘差之間沒有明顯的相關性。為了進壹步分析模型的正態性,即殘差ε是否服從正態分布,我們做了殘差分布直方圖和正態PP圖(見圖1和圖2)。可以看出,該模型的殘差基本服從正態分布。

圖1殘差分布直方圖圖2殘差的正態PP圖。

結論

根據以上實證研究,我們得出以下結論:

1.在65438+2002年2月3日至65438+2004年3月8日期間,上證50指數50只樣本股的收益受19關鍵因素的影響。這些19關鍵因素中最具代表性的是600028中國石化、600602廣電電子等22只樣本股。從另壹個角度看,這22只樣本股的整體走勢基本反映了上證50指數50只樣本股的走勢。

2.影響上證50指數的關鍵因素具有很強的板塊效應。企業性質、主營業務、區域特征、經營業績相同或相似的股票走勢高度相關,可歸為同壹關鍵因素。然而,與此同時,個股的表現同樣出色。幾乎每個部門都有獨特的表現。由於管理、資本運作等諸多原因,這些特立獨行的股票走出了自己的特色,成為市場不可或缺的亮點,為指數做出了重要貢獻。

3.從個股對上證50指數關鍵因子的影響來看,如果壹個關鍵因子所代表的樣本股數量少,就說明這些樣本股更具代表性。相反,如果壹個關鍵因素所代表的樣本股數量較多,則說明這些樣本股具有可替代性,也就是說,如果需要調整投資組合,可以在代表大部分樣本股的因素中進行調整,不會影響投資組合的代表性。

4.如果要指數化上證50指數,不需要投資全部50只樣本股,只需要投資最能代表19關鍵因素的22只重點樣本股即可。投資組合如下:投資組合50 = 0.1267 *(600028)+(600808)+(600688)+(600019))+0.0821 *(600602)+(600664)+0.0287 *(600839)+0.0284 *(6005994)檢驗結果表明,這22只具有代表性的重點樣本股構建的組合Portfolio50的收益率基本反映了上證50指數的Index50的收益率,它們的風險處於同壹水平,即可以用組合Portfolio50代替上證50指數進行指數化投資。此外,由於同壹關鍵因素所代表的股票具有可替代性,因此投資組合Portfolio50的結構更加靈活,我們可以根據市場的具體情況調整投資組合Portfolio50,而不影響其在指數上的反映。

上述結論表明,我們從實證研究的角度驗證了關鍵因素擬合指數投資法,即指數投資不必完全照搬股票指數,股票指數中存在關鍵因素。利用這些關鍵因素構建的投資組合可以擬合相應的股票指數進行指數化投資。該方法可適用於多種指標,操作靈活、主動。基金經理可以同時結合其他分析工具,根據市場的具體情況調整擬合的投資組合,從而達到最佳的投資業績。