拉依達準則(3σ準則)
設對被測量進行等精度測量,獨立得到x1,x2...,xn,算出其算術平均值x及剩餘誤差vi=xi-x(i=1,2,...,n),並按貝塞爾公式算出標準偏差σ,若某個測量值xb的剩餘誤差vb(1<=b<=n),滿足下式
|vb|=|xb-x|>3σ
則認為xb是含有粗大誤差值的壞值,應予剔除。
在整理試驗數據時,往往會遇到這樣的情況,即在一組試驗數據里,發現少數幾個偏差特別大的可疑數據,這類數據稱為Outlier或Exceptional Data,他們往往是由於過失誤差引起。
可疑數據的處理
對於可疑數據的取捨要慎重。在試驗進行中時,若發現異常數據,應立即停止試驗,分析原因並及時糾正錯誤;當為試驗結束後時,應先找原因,在對數據進行取捨。如發現生產(施工)、試驗過程中,有可疑的變異時,該測量值則應予捨棄。
這類數據的不能清楚地判定原因時,可以藉助一些統計方法進行驗證處理,方法很多,如常用的"拉依達準則"和"格拉布斯準則",還有如狄克遜準則,肖維勒準則、t檢驗法,F檢驗法等。這些方法,都有各自的特點,例如,拉依達準則不能檢驗樣本量較小(顯著性水平為0.1時,n必須大於10)的情況,格拉布斯準則則可以檢驗較少的數據。在國際上,常推薦格拉布斯準則和狄克遜準則。
但對於異常數據一定要慎重,不能任意的拋棄和修改。往往通過對異常數據的觀察,可以發現引起系統誤差的原因,進而改進過程和試驗。