淺談風控三方資料
前言
金融的核心是風控,即解決資訊不對稱的問題,對客戶信用風險評估;風控的核心是資料,尤其是現在量化風控模式下,風控資料尤為重要;當銀行、非銀機構自身資料不足以支撐量化風控的需求,即會尋求與第三方資料機構合作,接入資料,完善內部風控需求。
監管趨嚴(重點法規)、授權是前提,明確寫明授權機構、授權使用場景;避免接觸各類敏感資訊,可透過評分代替直接資料互動;確保合規化、多元化。
一、三方資料概述
1、簡介
資料廠商:百融、同盾、百度、阿里、騰訊、京東、銀聯、睿智科技(FICO)等;他們主要提供多頭借貸資料、黑名單、裝置指紋、信用評分等資料。
這些第三方資料大體可以劃分為以下幾類:身份核驗、名單類、行為類、信用評分類、客戶畫像類等。
2、資料型別
身份核驗類:透過驗證客戶申請資訊之間的關聯關係,來判斷客戶的風險。
姓名、年齡、性別、學歷、郵箱、地址、職業等;
身份證二要素、手機號三要素驗證、銀行卡四要素;
OCR認證、活體檢測;
名單類:
黑名單:
違約風險名單:信貸逾期、用途風險、不良客戶、長期拖欠客戶、重點催收客戶;
欺詐風險名單:惡意欺詐、垃圾賬號、資料虛假、疑似存在欺詐歷史、同行中介;
多頭風險名單:徵信多頭、機構多頭;
特殊名單:涉訴名單、法院被執行人名單、政府失信名單、限制高消費名單;
白名單:
徵信正常,無逾期歷史的優質貸款客戶;
特定公司、職業、收入客戶;
從未發生借貸記錄的客戶;
行為類:
徵信資料:
查詢記錄:查詢原因、查詢次數;
信貸記錄:未結清、未銷戶賬戶數;發生過逾期的賬戶數;發生過90天以上逾期的賬戶數:
公共記錄:欠稅記錄、民事判決記錄、強制執行記錄 、行政處罰記錄、電信欠費記錄;
逾期資料:
逾期金額、歷史逾期總次數、逾期未還款行為、最大逾期金額、最大逾期天數、逾期機構數、履約機構數、異常還款機構數;
多頭資料,包括多頭申請、多頭拒貸、多頭放款、多頭逾期、信用狀態/負債報告等;
信用評分類:
申請評分(A卡):基於貸款客戶在多家金融機構信貸違約資料樣本,開發客戶還款能力的模型,評估申請人的信用風險;
行為評分(B卡):利用貸款客戶的歷史資料和行為特徵等制定貸中行為評分模型,對客戶劃分風險等級;
催收評分(C卡):利用貸款客戶入催後的還款及逾期行為等資料,開發貸後催收模型,評估入催客戶的風險等級;
欺詐評分(F卡):將使用者各個維度的資料和特徵,與欺詐建立起關聯關係,並給出欺詐的機率;
聯合建模:為充分利用雙方資料,避免敏感資料輸出,開展聯合建模,提升模型區分度;
客戶畫像類:
人行徵信畫像:基於人行徵信報告的客戶畫像;
運營商畫像:三大運營商消費資料;
電商消費畫像:消費頻次、消費金額、消費產品、出行記錄等;
裝置畫像:裝置環境、裝置行為、裝置採集、裝置名單等;
3、主流供應商
百融、同盾、百行徵信、鵬元徵信、數美、冰鑑、睿智(fico)、白騎士、極光大資料、摩蠍;
百度、阿里、騰訊、京東;
三大運營商子公司、銀聯體系;
二、三方資料接入
對於信貸機構來說,當自有資料不足以滿足風控需求時,會引入外部的第三方資料來提升自己的風控水平。三方資料的接入主要包括:商務洽談(產品溝通)、資料評估、商務洽談(協議簽署)、資料接入等。
1、商務洽談(產品溝通)
由信貸機構的商務人員,根據業務需求尋求新的資料廠商和新的資料產品,同三方資料廠商建立溝通關係,瞭解三方資料公司背景、產品型別、簽署保密協議等;
2、資料評估
商務完成前期產品溝通及保密協議簽署後,開始三方風控資料的測試工作,驗證資料質量。
資料要求
資料合規:三方資料來源經過充分授權,符合國家相關法律法規;
資料真實:資料來源真實可靠,資料內容未經篡改或加工;
資訊準確:資料解析準確,避免出現亂碼、錯位、錯值、空值等資料錯誤;
持續穩定:資料穩定,避免出現引起業務停滯的重大服務中斷事故;
覆蓋完善:所供資料覆蓋範圍完整,資料完備程度高,可製成業務決策;
更新及時:資料返回時間、資料更新時間符合業務需求;
價格合理:資料收費模式合理;
評估指標:
查得率:測試樣本的查得樣本數佔總測試樣本的比例,如將10000條資料提供至廠商,返回9000條,查得率為90%;
混淆矩陣:
準確率:預測準確佔全部資料的比例,(TP+TN)/ (TP+TN+FP+FN);
錯誤率:1-準確率;
查全率:所有實際為正例的資料中,被預測為正例的比例,TP/(TP+FN);
查準率:所有被預測為正例的資料中,真正為正例的比例,TP/(TP+FP);
IV值:三方資料提供的特徵變數對模型的重要性,IV>0。2為較高重要性;
psi:三方資料提供的特徵變數的穩定性,PSI<0。1,穩定性較好;
相關性:三方資料提供的特徵變數與樣本標籤的相關性,相關係數r>0。6,為高相關性;
3、商務洽談(正式合作協議簽署)
結合三方資料評估結果,確認需要接入的資料產品後,商務人員開始下一輪商務洽談,包括資料價格、合同期限、正式協議簽署等。
三、三方資料應用
1、貸前准入
身份資訊核查:基於運營商、OCR識別等驗證客戶身份;
借貸意向:識別貸款申請客戶的多平臺借款意向和借款行為;
惡意欺詐風險識別:多維度匹配,結合不良信用記錄及風險事件距今時長,甄別欺詐風險;
客群分層:基於特定客群在多家金融機構信貸違約資料樣本,開發信用風險模型;
入模變數:基於內部積累資料,提供入模變數,提高模型準確度、區分度;
2、貸中管理
行為評分:利用貸款客戶的歷史資料和行為特徵等制定貸中行為評分模型,對客戶劃分風險等級,實行不同的貸中風險管控措施;
還款能力評估:提供客戶收入、公積金類反應客戶收入的資料,對客戶的還款能力進行再次評估;
甄別高風險客戶:多頭借貸、高風險客戶名單,攔截高風險客戶;
客戶號碼狀態核查:判斷貸中存量客戶號碼狀態,給出相應的狀態標籤,及時發現風險;
3、貸後催收
催收評分:透過貸後行為評分模型準確地預測的還款機率,根據還款可能性對客戶進行分層,輔助貸後策略;
客戶資訊完善:在合法合規的情況下,完善客戶資訊,提升客戶可聯率;
未完,待續……