當前位置:股票大全官網 - 股票投資 - 描述集中度趨勢的指標有哪些?其適用範圍有何異同?

描述集中度趨勢的指標有哪些?其適用範圍有何異同?

常用的描述變量濃度趨勢的統計指標有:算術平均值、幾何平均值和中位數。算術平均適用於對稱分布尤其是正態分布的數據,幾何平均適用於可由對數轉換為對稱分布的數據。中位數適用於各種分步數據,常用於非高峰數據。

壹、集中度趨勢描述

1.算術平均值:所有數值的總和除以數值的個數。用來描述壹組數據在數量上的平均水平。

計算公式:

優缺點:算術平均值是能充分利用現有信息的代表值,每個值的變化都會引起其變化。所以容易被極值影響,會掩蓋數據的差異。

例:最近更新了2018深圳市職工月平均工資,達到9309元。這是壹個算術平均數的實際應用。我們應該精益求精,努力成為先鋒而不是鶴尾。

2.幾何平均數:每個數值的連續乘積的平方根。壹般用於求各階段(環節)總結果為各階段(環節)連續乘積時的總結果。

計算公式:

優缺點:幾何平均值受極值的影響比平均值小。但只適用於等比或近似等比關系的數據。

例:求連續作業的車間產品的平均不良率。壹個產品的生產由三個環節組成。每個環節都會產生壹些次品。次品率依次為5%、2%和6%。求該產品的平均次品率。

因為每個環節都是依次發生的,需要完成上壹個環節的合格產品才能進入下壹個環節,所以每個環節的不良率是壹個產品關系。

根據上述公式,該產品整個生產過程的平均不良率為3.91%。

3.中位數:將數值從小到大排列,中間值為中位數。如果值的個數是奇數,則是中間位置的值;如果值的個數是偶數,則是中間兩個數的算術平均值。

優缺點:不受極值影響,通過丟失壹些信息來換取指數的穩定性。但對極值缺乏敏感性,樣本量較小時中位數不穩定。

例:畢業生得到兩個offer不到,即A公司和B公司..甲公司該部門工資為400元、500元、600元、丁20000元,乙公司為1000元、1500元、耿2000元、辛8000元。

A公司和B公司的平均月薪分別為5375元和2675元。這時,算術平均值已經因為極值而失去了代表作用。A公司和B公司的月薪中位數,550元和1750元,更能代表數據。

4.模式:數據中出現頻率最高的值。如果兩個或兩個以上的數值並列次數最多,那麽這些數值就是數據集的模式。如果所有值出現的次數相同,則該數據集中沒有模式。

優缺點:可用於數值型數據,也可用於非數值型數據。數據越多越有代表性,不受極值影響。

例子:壹家賣鞋的店鋪,參考之前的消費數據,得出女鞋銷售碼數的模式是37碼,男鞋銷售碼數的模式是42碼,所以店鋪備貨的時候,女鞋37碼,男鞋42碼需要安排更多的庫存。

5.截斷均值?數據排序後,按照壹定比例去掉兩端的數據,只使用中間的數據求平均值。

如果截尾均值與原均值相差不大,說明數據中沒有極值,或者兩端極值的影響只是抵消;如果截尾均值與原始均值相差較大,說明數據中存在極值,截尾均值更能反映數據的集中趨勢。

優缺點:算術平均容易受到極值的影響,截斷平均是壹種改進,在壹定程度上減少了極值對平均值的影響。

例:10某藝術比賽評委給出的分數如下:47,56,74,42,83,75,69,71,76,69。如果去掉最高分83和最低分42,平均分是: