聚類分析與判別分析如何結合運用?使用者29683258462192922020-01-02 15:34:20

1。聚類分析與判別分析的區別與聯絡都是研究分類的,在進行聚類分析前,對總體到底有幾種型別不知道(研究分幾類較為合適需從計算中加以調整)。判別分析則是在總體型別劃分已知,對當前新樣本判斷它們屬於哪個總體。如我們對研究的多元資料的特徵不熟悉,當然要進行聚類分析,才能考慮判別分析問題。

2。聚類分析分兩種:Q型聚類(對樣本的聚類),P型聚類(對變數的聚類)聚類分析需要注意的是,一般小樣本資料可以用系統聚類法,大樣本資料一般用快速聚類法(K均值聚類法)。需要根據統計量判斷分幾類比較合適,一般用R平方統計、偽F統計量等。如用前者時,可以從R平方的變換看n個樣品分成幾類比較合適,如分為5類時,R平方為0。9,當分為四類時,其值減小較快,如R平方為0。4,則認為分五類比較合適。另外,不同的分類方法產生的分類結果可能不同,要結合實際情況選出最優的分類方法。

3。判別分析有Fisher判別,Bayes判別和逐步判別。一般用Fisher判別即可,要考慮機率及誤判損失最小的用Bayes判別,但變數較多時,一般先進行逐步判別篩選出有統計意義的變數,再結合實際情況選擇用哪種判別方法。