檢驗數據是否服從正態分布的方法有很多,如正態性檢驗(S-W檢驗、K-S檢驗)、峰度和偏度、圖表化(直方圖、p-p/q-q圖)。
正態性檢驗,顧名思義,是判斷總體是否服從正態分布的檢驗。它是統計判斷中擬合優度的壹個重要而特殊的假設檢驗。SPSSAU提供了以下三種常規測試方法:
三種正態性檢驗方法的區別如下:
軟件測試通常要求樣本量小於50。如果樣本量大於50,建議采用K-S檢驗。JB檢驗是基於數據樣本的偏度(統計數據分布的偏度方向和程度的度量)和峰度分析(代表概率密度分布曲線在平均值處的峰值的特征數),壹般用於大樣本分析。正態性檢驗屬於非參數檢驗,原假設是“樣本來自的總體符合正態分布無顯著差異”,即當P
峰度和偏度如何檢驗數據的正態分布?
偏斜度和峰度
偏度又稱偏度,描述的是數據分布的偏度和方向,峰度描述的是數據分布曲線的陡度和緩度的統計。理論上,標準正態分布的偏度和峰度都是0,但現實中,數據並不能滿足標準正態分布。所以,如果峰度的絕對值小於10,偏度的絕對值小於3,說明數據雖然不是絕對正態,但基本可以接受正態分布。參考資料:Kline R,Kline R B,Kline R .結構等式建模的原理與實踐[J].美國統計協會雜誌,2011,101 (12)。此外,還有可以驗證的圖表,如直方圖、p-p/q-q圖等。
圖示
除了正態性檢驗、偏度、峰度等方法,還可以用圖形分析數據是否符合正態分布。包括直方圖和p-p/q-q圖。
柱狀圖
如果使用直方圖,如果直方圖呈現‘中間高兩邊低,左右基本對稱的鐘形’,基本服從正態分析,但數據太少也可能影響結果,難以呈現標準的正態分布。如果是這種情況,看到壹個‘鐘形’是可以接受的。例如:
從上圖可以看出,數據的分布不是很對稱,但也有近似的‘鐘形’曲線,可以勉強接受。
P-p/q-q圖
p-p圖和q-q圖都是根據累積分布函數理論計算的。它們可以用來檢驗數據的分布,但通常用來檢驗數據是否服從正態分布。如果圖中所有的店鋪都聚集在壹條直線上,說明變量的分布服從待檢驗的分布。直觀的說法是,如果散亂點的分布近似呈對角線,則可以認為是正態分布。例如:
從上圖可以看出,散亂點的分布近似呈對角線狀,因此可以認為是正態分布。q-q圖也是如此。
幾種方法的描述
以上幾種顯示正態性檢驗的方法,大致可以分為三種:正態性檢驗、偏態和峰度、圖解法,其中以正態性檢驗最為嚴格,但從實用的角度來看,正態性檢驗遠不如偏態和峰度、圖解法實用,有時經常會出現這樣的結果,當數據的偏態絕對值小於3峰度且小於10,或者p-p圖呈現近似“對角線”的結果時。這時候建議不要過分依賴正態性檢驗,因為正態性檢驗要求比較嚴格,通常無法滿足,所以在分析中可以用另外兩種方法輔助判斷。