2016年5月28日 星期六

常態分佈Normal Distribution的定義

    常態分佈又稱高斯分佈Gaussian Distribution,要進行統計前要先確認這些變項中數值的分佈情況,標準的常態分佈是以平均值mean為中心,標準差standard deviation;SD為座標軸所繪出之分佈,型狀似對稱之鐘形.其中可能是瘦形或寬形或是不對稱之偏倚形,其偏移的形態又與眾數mode;中位數median與平均值相關,理想的常態分佈為mode=median=mean(symmetrical),當然其變異量variability即差距range,變異數variance,標準差及變異係數coefficient of variance;CV越小越好.

如何檢測常態分佈及常態分佈的測試
1.中央趨勢central tendency,即非常對稱的分佈(mode=median=mean),若非對稱的分佈,則須考量其偏態skewness及峰度kurtosis
2.四分位數間距interquartile rang,IQR:IQR=Q3-Q1,通常用標準差與IQR/1.35來做比較,SD=IQR/1.35為常態分佈;SD>IQR/1.35,則為重尾;SD<IQR/1.35,則為輕尾
3.常態分佈的測試會以樣品數來判斷,少於50則看Shapiro-Wilk的W值;大於50則看Kolomogorov的D值,無論W值或D值,其虛無假設H0中,若p<0.05則推翻H0,表非常態分佈;p>0.05則接受H0,表常態分佈.因此在生物統計中當p<0.05時為非常態分佈即其為顯著差異之統計結果.
    但在生產線上的統計需求則不是需要其具有顯著之差異,而是藉由標準差之掌握,來控制生產品質之要求及精進,所以需要的是其常態分佈性的分析.

常態分佈與標準差之關係圖


沒有留言:

張貼留言