如何用SPSS和Clementine處理缺失值,離群值,極值?
使用者681314193780423 發表于 農業2019-12-11
對於資料中出現的缺失值、離群值和極值,提供以下方法:
1、這些異常值可以全部刪除,只留下完整、正常的資料;
2、對於缺失值,可以使用已有資料的平均值代替,或者用NULL等符號表示
3、對於離群值,要看分析內容。如果分析目的是監測異常為主,則重點考慮此類離群值,可能存在漏稅、駭客攻擊、賴賬等問題。如果分析群體共性問題,則可以刪除;
4、對於極值,可要考慮其範圍;因為極值可能是準確的點,也有可能是異常點;