如何用SPSS和Clementine處理缺失值,離群值,極值?使用者6813141937804232019-12-31 23:23:45

對於資料中出現的缺失值、離群值和極值,提供以下方法:

1、這些異常值可以全部刪除,只留下完整、正常的資料;

2、對於缺失值,可以使用已有資料的平均值代替,或者用NULL等符號表示

3、對於離群值,要看分析內容。如果分析目的是監測異常為主,則重點考慮此類離群值,可能存在漏稅、駭客攻擊、賴賬等問題。如果分析群體共性問題,則可以刪除;

4、對於極值,可要考慮其範圍;因為極值可能是準確的點,也有可能是異常點;