前言

金融的核心是風控,即解決資訊不對稱的問題,對客戶信用風險評估;風控的核心是資料,尤其是現在量化風控模式下,風控資料尤為重要;當銀行、非銀機構自身資料不足以支撐量化風控的需求,即會尋求與第三方資料機構合作,接入資料,完善內部風控需求。

監管趨嚴(重點法規)、授權是前提,明確寫明授權機構、授權使用場景;避免接觸各類敏感資訊,可透過評分代替直接資料互動;確保合規化、多元化。

一、三方資料概述

1、簡介

資料廠商:百融、同盾、百度、阿里、騰訊、京東、銀聯、睿智科技(FICO)等;他們主要提供多頭借貸資料、黑名單、裝置指紋、信用評分等資料。

這些第三方資料大體可以劃分為以下幾類:身份核驗、名單類、行為類、信用評分類、客戶畫像類等。

2、資料型別

身份核驗類:透過驗證客戶申請資訊之間的關聯關係,來判斷客戶的風險。

姓名、年齡、性別、學歷、郵箱、地址、職業等;

身份證二要素、手機號三要素驗證、銀行卡四要素;

OCR認證、活體檢測;

名單類:

黑名單:

違約風險名單:信貸逾期、用途風險、不良客戶、長期拖欠客戶、重點催收客戶;

欺詐風險名單:惡意欺詐、垃圾賬號、資料虛假、疑似存在欺詐歷史、同行中介;

多頭風險名單:徵信多頭、機構多頭;

特殊名單:涉訴名單、法院被執行人名單、政府失信名單、限制高消費名單;

白名單:

徵信正常,無逾期歷史的優質貸款客戶;

特定公司、職業、收入客戶;

從未發生借貸記錄的客戶;

行為類:

徵信資料:

查詢記錄:查詢原因、查詢次數;

信貸記錄:未結清、未銷戶賬戶數;發生過逾期的賬戶數;發生過90天以上逾期的賬戶數:

公共記錄:欠稅記錄、民事判決記錄、強制執行記錄 、行政處罰記錄、電信欠費記錄;

逾期資料:

逾期金額、歷史逾期總次數、逾期未還款行為、最大逾期金額、最大逾期天數、逾期機構數、履約機構數、異常還款機構數;

多頭資料,包括多頭申請、多頭拒貸、多頭放款、多頭逾期、信用狀態/負債報告等;

信用評分類:

申請評分(A卡):基於貸款客戶在多家金融機構信貸違約資料樣本,開發客戶還款能力的模型,評估申請人的信用風險;

行為評分(B卡):利用貸款客戶的歷史資料和行為特徵等制定貸中行為評分模型,對客戶劃分風險等級;

催收評分(C卡):利用貸款客戶入催後的還款及逾期行為等資料,開發貸後催收模型,評估入催客戶的風險等級;

欺詐評分(F卡):將使用者各個維度的資料和特徵,與欺詐建立起關聯關係,並給出欺詐的機率;

聯合建模:為充分利用雙方資料,避免敏感資料輸出,開展聯合建模,提升模型區分度;

客戶畫像類:

人行徵信畫像:基於人行徵信報告的客戶畫像;

運營商畫像:三大運營商消費資料;

電商消費畫像:消費頻次、消費金額、消費產品、出行記錄等;

裝置畫像:裝置環境、裝置行為、裝置採集、裝置名單等;

3、主流供應商

百融、同盾、百行徵信、鵬元徵信、數美、冰鑑、睿智(fico)、白騎士、極光大資料、摩蠍;

百度、阿里、騰訊、京東;

三大運營商子公司、銀聯體系;

二、三方資料接入

對於信貸機構來說,當自有資料不足以滿足風控需求時,會引入外部的第三方資料來提升自己的風控水平。三方資料的接入主要包括:商務洽談(產品溝通)、資料評估、商務洽談(協議簽署)、資料接入等。

1、商務洽談(產品溝通)

由信貸機構的商務人員,根據業務需求尋求新的資料廠商和新的資料產品,同三方資料廠商建立溝通關係,瞭解三方資料公司背景、產品型別、簽署保密協議等;

2、資料評估

商務完成前期產品溝通及保密協議簽署後,開始三方風控資料的測試工作,驗證資料質量。

資料要求

資料合規:三方資料來源經過充分授權,符合國家相關法律法規;

資料真實:資料來源真實可靠,資料內容未經篡改或加工;

資訊準確:資料解析準確,避免出現亂碼、錯位、錯值、空值等資料錯誤;

持續穩定:資料穩定,避免出現引起業務停滯的重大服務中斷事故;

覆蓋完善:所供資料覆蓋範圍完整,資料完備程度高,可製成業務決策;

更新及時:資料返回時間、資料更新時間符合業務需求;

價格合理:資料收費模式合理;

評估指標:

查得率:測試樣本的查得樣本數佔總測試樣本的比例,如將10000條資料提供至廠商,返回9000條,查得率為90%;

混淆矩陣:

準確率:預測準確佔全部資料的比例,(TP+TN)/ (TP+TN+FP+FN);

錯誤率:1-準確率;

查全率:所有實際為正例的資料中,被預測為正例的比例,TP/(TP+FN);

查準率:所有被預測為正例的資料中,真正為正例的比例,TP/(TP+FP);

淺談風控三方資料

IV值:三方資料提供的特徵變數對模型的重要性,IV>0。2為較高重要性;

psi:三方資料提供的特徵變數的穩定性,PSI<0。1,穩定性較好;

相關性:三方資料提供的特徵變數與樣本標籤的相關性,相關係數r>0。6,為高相關性;

3、商務洽談(正式合作協議簽署)

結合三方資料評估結果,確認需要接入的資料產品後,商務人員開始下一輪商務洽談,包括資料價格、合同期限、正式協議簽署等。

三、三方資料應用

1、貸前准入

身份資訊核查:基於運營商、OCR識別等驗證客戶身份;

借貸意向:識別貸款申請客戶的多平臺借款意向和借款行為;

惡意欺詐風險識別:多維度匹配,結合不良信用記錄及風險事件距今時長,甄別欺詐風險;

客群分層:基於特定客群在多家金融機構信貸違約資料樣本,開發信用風險模型;

入模變數:基於內部積累資料,提供入模變數,提高模型準確度、區分度;

2、貸中管理

行為評分:利用貸款客戶的歷史資料和行為特徵等制定貸中行為評分模型,對客戶劃分風險等級,實行不同的貸中風險管控措施;

還款能力評估:提供客戶收入、公積金類反應客戶收入的資料,對客戶的還款能力進行再次評估;

甄別高風險客戶:多頭借貸、高風險客戶名單,攔截高風險客戶;

客戶號碼狀態核查:判斷貸中存量客戶號碼狀態,給出相應的狀態標籤,及時發現風險;

3、貸後催收

催收評分:透過貸後行為評分模型準確地預測的還款機率,根據還款可能性對客戶進行分層,輔助貸後策略;

客戶資訊完善:在合法合規的情況下,完善客戶資訊,提升客戶可聯率;

未完,待續……