邏輯迴歸模型建模步驟?木子林2022-01-10 14:02:25

1,構建所需的資料集,根據實驗的視窗,構建邏輯迴歸資料結構,例如 用過去12個月資料 做購買率的模型訓練,這部分包含訓練資料集與測試資料集,

2。變數的轉化與預處理。

其中去掉缺失值較多的變數,購買率分佈較集中的變數,即購買機率的變化不隨自變數變化而變化的變數,即數值集中程度較高的變數。與Y不相關的變數。

3。變數的刪選(特徵工程)(caret包)

將高維即數量太龐大的自變數群,降維致較少的變數組合,(例如降至80以下 或者20左右),這部分步驟主要來降維的同時,期望消去變數之間的共線性,相關性等因素

4。模型的構建(glm 包/step() )

根據實際商業的目的,挑選第三步後剩下的變數,並調參,找到是整個系統平滑穩定的變數組合,例如10個變數,其中每個變數權重期望分佈均勻,且滿足模型其他各項基本指標,如C值 AUC等。

5。模型的評估 與描述

將構建完成的模型,將所有客戶的購買率給出,並從高到低排序,總人群均分為10類 。輸出模型結果 其中理想效果是 :購買率高的客戶群為總體平均購買率人群的兩倍既兩倍以上,即高的購買率是總體平均購買率的兩倍。