首先,我們來介紹一下單因素分析和多因素分析,單因素分析是指在一個時間點上,研究不同水平的某因素對一個獨立變數變數的影響程度的分析。即實驗處理僅為一個方向,如研究不同藥物對病例狀態恢復的影響等。多因素分析是對一個獨立變數是否受一個或多個因素或變數影響而進行的分析。

一般情況下,進行建模之前使用單因素或者多因素分析,可以初步探究因變數與自變數之間的關係,再做下一步計算。但是,我們在做分析時有可能遇到這種情況,例如:某個變數單因素分析顯著,但是多因素分析又不顯著影響,這時候該怎麼辦呢?別擔心,下面這個表格帶你分析這幾種案例。

統計分析:單因素多因素分析

對於一個因素,做完單因素和多因素分析後有四種情況,當單因素和多因素分析結果相同時,很好判斷是否納入到接下來的模型。

但是出現B、D這種相互矛盾的情況該怎麼處理?對於這兩種情況,都有相應的解釋。

01

B情況

單因素結果表明有顯著影響但是多因素表明沒有影響,一般是由於混雜因素對這種因素的作業進行了掩蓋,在多因素分析中,這種混雜因素的作用被減弱,因素的影響又變得顯著,比如研究教育程度和是否應屆生對工資的影響。

針對較預測到和是否應屆生的交叉,樣本中教育程度高的應屆生居多,教育程度低的非應屆生居多,不考慮是否應屆生,你會發現教育程度的均值沒有差別。因為非應屆生一般工資會偏高,即使教育程度低工資也可能和教育程度高的應屆生工資差不多。如果做雙因素方差分析,則你會發現教育程度的均值是有差別的。

解決辦法:

對這些變數進行PSM傾向性匹配處理,或者擴大樣本量都是比較好的解決辦法。

嚴格來說,傾向性得分算不得一種“分析”方法,而是一種用於資料處理的方式,常用於觀察性研究混雜因素的控制。

比如你想研究施加某種干預對結局指標是否有改善,資料來自回顧性的既有資料的收集,由於是觀察性研究,大機率存在混雜因素在組間不均衡的問題(如基線不平),這個時候你就可以考慮傾向性得分分析了。

02

D情況

單因素結果表明不顯著影響但是多因素表明有影響,

一般是出現了共線性,也就是因素A和因素B有相同的變化趨勢,但真正影響因變數的只有B,A是一種虛假的相關關係。

解決方法:

一般可以進行相關性和共線性分析來解決這一種難題。滿足相關性和共線性要求,對傳統統計模型的建立十分重要,在建模之前進行這些檢驗,讓變數更符合輸入的形式,都可以提升模型的擬合效果。

03

平臺實操

作為模型建立的預處理部分,單/多因素分析,PSM傾向性匹配,相關性共線性檢測等,都可以在我們平臺輕鬆地實現,具體演示如下。

(1)單因素多因素分析

在分析欄選擇因變數,自變數,即可得到分析結果,透過OR值、p值和森林圖來判斷自變數對因變數是否有顯著影響。

可以根據不同的因變數選擇不同的迴歸模型:邏輯迴歸適合二分類,線性迴歸適合連續性因變數,加入隨訪時間後可以選擇cox迴歸模型等。

(2)PSM傾向性匹配

在分析欄輸入分組變數和需要分析的變數,選擇匹配比例即可輸出匹配的結果,點選儲存進行下一步研究。

統計分析:單因素多因素分析

(3)共線性相關性分析

在分析欄輸入需要分析相關性的變數組合,即可輸出相關矩陣和相關矩陣熱力圖哦,值得一提的是,熱力圖顏色靠近兩極的色塊對應的兩個變數即是相關性過高的變數,我們還提供了不同期刊上的配色方案,可以繪製各種顏值高的熱力圖。

統計分析:單因素多因素分析

共線性的檢驗則是直接輸出VIF值,一般認為VIF>10後存在較嚴重的共線性。

統計分析:單因素多因素分析

結語

臨床研究的根本使命是發現並解決生命科學領域亟待解決的臨床問題,同時,為即將發生的臨床難題提供備選解決方案。

開啟

極智分析—智慧醫學統計分析平臺

https://www.xsmartanalysis.com/

進行實操吧!