離群值 或異常值(outlier)是什麼?

離群值或異常值(outlier)是指在數據中有一個或幾個數值與其他數值相比呈現很大的差異。當出現離群值的時候,需要特別處理,代表該離群值的可信度有待驗證。通常需要重新檢查原始數據是否出現錯誤,能否從專業上找到合理的解釋,或由專業及統計學的觀點來檢查該離群值與其他數值是不是經由同一機制所產生或是否屬於同一總體。如果確認原始數據的確存在邏輯錯誤,且也無法在找到該觀察對象進行核實,則只能將該觀測值刪除。

因為極端值的存在,可能會嚴重影響到很多統計量的估計值,而造成偏差,影響統計分析結果。

離群值或異常值(outlier)產生的原因

(1)總體固有變異的極端表現, 這是真實而正常的數據, 只是在這次實驗中表現的剛好出現極端值,這類離群值與其餘觀測值屬於同一總體。
(2)由於試驗條件和實驗方法的偶然性, 或觀測、 記錄、計算時的失誤所產生的結果,是一種
非正常的、錯誤的數據,這些數據與其余觀測值不屬於同一總體,需將該觀測值刪除。

 

 

 

 

延伸閱讀》

超重要!借車給家人出車禍,您投保的汽車保險賠不賠?

信用卡》最強刷卡現金回饋排行榜【非業配】(報稅用哪張?)

小心!!「房貸轉貸」及「房貸增貸」所延伸的利息支出,都不能列舉購屋借款利息扣除

 申請房貸必看!「青年安心成家購屋優惠貸款」的申請條件及優惠內容!

 

 

 
 
arrow
arrow
    全站熱搜

    黃大偉 發表在 痞客邦 留言(0) 人氣()