邏輯迴歸模型建模步驟？

木子林2022-01-10 14:02:25

1，構建所需的資料集，根據實驗的視窗，構建邏輯迴歸資料結構，例如用過去12個月資料做購買率的模型訓練，這部分包含訓練資料集與測試資料集，

2。變數的轉化與預處理。

其中去掉缺失值較多的變數，購買率分佈較集中的變數，即購買機率的變化不隨自變數變化而變化的變數，即數值集中程度較高的變數。與Y不相關的變數。

3。變數的刪選（特徵工程）（caret包）

將高維即數量太龐大的自變數群，降維致較少的變數組合，（例如降至80以下或者20左右），這部分步驟主要來降維的同時，期望消去變數之間的共線性，相關性等因素

4。模型的構建（glm 包/step（））

根據實際商業的目的，挑選第三步後剩下的變數，並調參，找到是整個系統平滑穩定的變數組合，例如10個變數，其中每個變數權重期望分佈均勻，且滿足模型其他各項基本指標，如C值 AUC等。

5。模型的評估與描述

將構建完成的模型，將所有客戶的購買率給出，並從高到低排序，總人群均分為10類。輸出模型結果其中理想效果是：購買率高的客戶群為總體平均購買率人群的兩倍既兩倍以上，即高的購買率是總體平均購買率的兩倍。

小蜜蜂問答