y=a+bx+cx2
其中, a 是常數項, b 是線性關系的系數, c 是平方項的系數 (說明:為了便於表述,這裏省去了控制變量和幹擾項)。
本文的目的在於分析加入平方項後我們該如何解釋系數的含義?有哪些需要特別註意的地方?
平方項顯著就壹定意味著存在 U 形關系嗎?
瀏覽現有的期刊論文,我們經常發現不少作者只要發現平方項的系數 c 在統計上顯著,便聲稱 y 和 x 之間存在「U 形關系」(c>0) 或「倒 U 形關系」(c<0) 。這並不嚴謹,有時甚至是錯誤的。
在社會科學研究中,我們必須考慮變量的經濟含義和取值範圍,這就使得我們不能像做初中代數習題那樣來分析包含平方項的模型。比如,研究「收入 (Income) 與年齡 (Age) 」的非線性關系時,Age 就不可能取負值,甚至不可能小於 18。同時,Age 的最大值也有限制,取決於研究對象及樣本特征。
壹旦考慮到 x 的取值範圍,再配合二次曲線轉折點的位置,我們便會發現,在樣本區間內 x∈[xmin,xmax],y 和 x 之間的關系可能僅僅是 U 形曲線的左半支或右半支,也即,y 和 x 之間的關系仍然是單調關系,只是 x 對 y 的邊際影響在變化 (遞增或遞減)。