上期為大家介紹了SIMCA16 OPLS操作教程,本期將為大家介紹SIMCA判別分類模型(PCA-Class)操作教程~

1.原始資料

透過判別分析來找組別之間的較佳判別變數,並結合分析來自不同資料組(訓練集與測試集)的資料。

小提示:

在資料整理時就要將訓練集與測試集分開

,這點很重要喲,關係著是否能成功建立PCA-Class模型。

乾貨連載 | 三分鐘學會SIMCA判別分類模型——PCA-Class

2.資料匯入

乾貨連載 | 三分鐘學會SIMCA判別分類模型——PCA-Class

乾貨連載 | 三分鐘學會SIMCA判別分類模型——PCA-Class

乾貨連載 | 三分鐘學會SIMCA判別分類模型——PCA-Class

乾貨連載 | 三分鐘學會SIMCA判別分類模型——PCA-Class

乾貨連載 | 三分鐘學會SIMCA判別分類模型——PCA-Class

3.自動擬合

乾貨連載 | 三分鐘學會SIMCA判別分類模型——PCA-Class

乾貨連載 | 三分鐘學會SIMCA判別分類模型——PCA-Class

4.新增主成分

乾貨連載 | 三分鐘學會SIMCA判別分類模型——PCA-Class

5.建立分組模型的DModX圖表

乾貨連載 | 三分鐘學會SIMCA判別分類模型——PCA-Class

乾貨連載 | 三分鐘學會SIMCA判別分類模型——PCA-Class

乾貨連載 | 三分鐘學會SIMCA判別分類模型——PCA-Class

6.更改橫座標名稱

乾貨連載 | 三分鐘學會SIMCA判別分類模型——PCA-Class

乾貨連載 | 三分鐘學會SIMCA判別分類模型——PCA-Class

7.更改顏色

乾貨連載 | 三分鐘學會SIMCA判別分類模型——PCA-Class

乾貨連載 | 三分鐘學會SIMCA判別分類模型——PCA-Class

此時DModX圖表是內部驗證,資料是訓練集40的個樣本。紅線為95%置信區間,圖中F組超過置信區間說明兩組樣本區分較大,不是同組樣本。

乾貨連載 | 三分鐘學會SIMCA判別分類模型——PCA-Class

乾貨連載 | 三分鐘學會SIMCA判別分類模型——PCA-Class

同理,在模型二中,F組都處於置信區間95%以內,屬於同組樣本。C組全部樣本都超過置信區間95%的紅線以上,與F組不是同組樣本。

8。預測集資料驗證模型

乾貨連載 | 三分鐘學會SIMCA判別分類模型——PCA-Class

乾貨連載 | 三分鐘學會SIMCA判別分類模型——PCA-Class

乾貨連載 | 三分鐘學會SIMCA判別分類模型——PCA-Class

乾貨連載 | 三分鐘學會SIMCA判別分類模型——PCA-Class

此時DModX圖表是外部驗證,資料是測試集的10個樣本。紅線為95%置信區間,圖中C組中有一個樣本超過置信區間,說明該樣本不屬於C組樣本。

乾貨連載 | 三分鐘學會SIMCA判別分類模型——PCA-Class

乾貨連載 | 三分鐘學會SIMCA判別分類模型——PCA-Class

同理,在模型二中,10個樣本正確分類。總的來說,外部驗證的DModXPS+圖得出,模型一將10個樣本中的9個正確分類,而模型二將10個樣本中的10個正確分類。

在這種情況下,另一個有用的工具是“Coomans’ plot”。該圖是透過在同一散點圖中共同繪製兩個模型的DModXPS+值而建立的。

乾貨連載 | 三分鐘學會SIMCA判別分類模型——PCA-Class

我們討論的最後一個圖——ROC圖。它繪製了真實預測率與錯誤預測率的關係。

乾貨連載 | 三分鐘學會SIMCA判別分類模型——PCA-Class

我們可以從上面的兩個ROC圖中看到,模型二有完美的外部驗證效能,而模型一的效能稍差。

今天小編關於PCA-Class繪製教程就到這了,大家有木有都會使用了呢。SIMCA軟體操作簡單靈活,是目前全球較受科研工作者歡迎的多元變數統計分析軟體,並已經成為多元變數統計分析的標杆。感興趣和有需求的老師立馬行動起來吧!

暖心的小編會持續為大家推出SIMCA16分析操作乾貨哦,大家盡請期待!

本文為阿趣代謝微信公眾號原創,歡迎個人轉發分享。其他任何媒體、網站如需轉載,須聯絡阿趣代謝微信公眾號獲得授權,並在正文前註明來源阿趣代謝微信公眾號。