從2014年正式提出網際網路+的概念到現在落地實施,短短時間內網際網路已滲透到人們衣食住行等日常生活的方方面面,這給正常的網際網路使用者帶來了現代生活的方便快捷,但同時也為網際網路上的欺詐和作弊行為留下“大量”繁衍的空間。

從產品生命週期的角度來看,一款網際網路產品從渠道推廣到使用者註冊、登入再到使用者業務活動,每一個環節都可能成為網際網路灰產實施欺詐和作弊行為以謀求非法利益的“舞臺”。有資料顯示,過千萬流量推廣預算中的60%都會被不良渠道商和羊毛黨等網際網路灰產收入囊中。

網際網路欺詐形成完整產業鏈

數美科技聯合創始人&CTO梁堃曾在受邀參加DataFun Talk活動演講中提到:網際網路上最猖獗的兩類灰色產業,一是透過參與平臺上的各種獎勵性質的業務活動來直接獲得利益,也稱薅羊毛;二是導流廣告。無論網際網路灰產想要透過薅羊毛還是導流廣告來獲取可觀的利益都需要進行“批次操作”。實現批次操作需要滿足的三大條件都已經發展出了大批的“供應商”:

大量手機號——卡商;

散佈在全國的IP——VPN提供商;

篡改、批次控制等軟體——軟體提供商。

灰產已然形成了專業分工的商業化“作案”流程。有資料顯示,中國參與網際網路灰產人數已經達到數十萬,產業規模佔GDP比例高達0。63%,超過4千億元。

數美科技CTO梁堃:灰產肆虐,單一反欺詐模型和策略還遠遠不夠

注:數美科技聯合創始人&CTO梁堃受邀出席“DataFun Talk”之演算法架構系列活動——AI在反欺詐中的應用實踐,並做了《人工智慧在反欺詐中的實踐——構建立體防禦體系》主題演講。

反欺詐面臨的挑戰及對應的解決方案

面對技能越發專業、規模逐漸龐大、流程趨近自動化的網際網路灰產,企業即使具備一定技術實力,甚至不惜投入大量的人力、財力於反欺詐的研發上,但在對抗網際網路灰產方面依舊存在懸殊的差距。數美科技聯合創始人&CTO梁堃解釋道:“由於一般情況下企業之間對抗網際網路灰產所得資料不互享,造成企業缺乏全域性的風險資料支撐。此情況為灰產違規獲利活動留下可操作空間。例如卡商利用這個漏洞簡單地進行手機號目錄結構分類,並將同一個手機號應用於不同的企業,就可以獲利。而在不同企業平臺上進行過欺詐行為的手機號慣犯對於剛面對該手機號的企業來說,卻是完全陌生的。”

而在解決網路欺詐問題時,內容反欺詐和行為反欺詐最為經典:

網際網路反欺詐經典問題一:內容反欺詐

網際網路平臺上最大的問題是以頭像、暱稱、私信、評論等為載體場景多變的導流廣告內容,其中不乏涉及色情、賭博等違法行業的廣告。在解決內容層面的欺詐作弊行為時,數美科技專業的反欺詐團隊運用了深度學習演算法、經典機器學習演算法等多種技術手段,解決內容反欺詐中面臨的語義分析、變體及干擾。

單一模型或演算法無法識別所有垃圾內容,數美科技在內容反欺詐方面運用的是深度學習演算法lstm理解記憶相對較長的語境,同時結合經典機器學習演算法SVM去捕獲當前段落內容中存在的垃圾短語,共同攔截垃圾內容。

內容反欺詐的難點之一是當網際網路灰產發現其垃圾內容被攔截後,會以變體內容的形式傳播以達道繞過反欺詐策略的目的。數美科技採用的Char&WordEmbedding則靠相似度去識別這種變體,同時對於在變體中加入的干擾手段則採用CRF序列標註先將干擾手段剔除,再對文字內容進行切詞等處理方式識別垃圾內容。

在用機器學習解決反欺詐問題時,深度神經網路、GBDT、SVM及隨機森林等機器學習演算法都可歸結為統計學習,對其解決的問題有“分佈統計相對穩定”的假設。而作弊時的行為是被刻意改變的,在統計學上分佈情況是不夠穩定的,對此,數美科技運用非監督的異常檢測(Anomalydetection)演算法,從統計學習穩定性的維度去識別這些異常點。該方法同樣適用於語音和影片。

網際網路反欺詐經典問題二:行為反欺詐

網際網路行為反欺詐中,渠道推廣時的虛假註冊、大量盜號以及網際網路產品或平臺在進行營銷活動時薅羊毛行為由來已久,針對傳統的反欺詐策略網際網路灰產技術也在不斷實現突破。例如:渠道推廣時的留存率驗證、手機驗證碼等都透過“與時俱進”的技術提升而繞過傳統的反欺詐策略。但行為欺詐存在“資源有限性”的核心問題。比如需要大量裝置。

數美科技全棧防禦體系根據虛擬機器存在的漏洞,在虛擬機器架構和CPU架構不一致時,透過檢測CPU架構的方法來識別虛擬機器。而針對Hook模式的裝置篡改手段,可透過掃描地址空間的特徵來識別;針對刷機的篡改手段,則透過統計手機型號下硬體資訊組合出現的小機率事件來識別。

數美科技CTO梁堃:灰產肆虐,單一反欺詐模型和策略還遠遠不夠

梁堃補充道,數美科技全棧防禦體系在識別篡改裝置時運用到的技術包括:

1、基於軟體特徵、硬體特徵、行為特徵的監督學習GBM模型;

2、硬體資訊相同與行為的異常點檢測;

3、裝置的集體行為挖掘的裝置農場識別;

4、包含對資源複用裝置有效識別和賬號異常識別的關聯分析和結對分析。

反欺詐不能期望於單一的模型或策略

數美全棧防禦體系立體式結合布控體系、資料體系和策略體系,推出四大產品系:基於關係網路的下一代智慧欺詐賬號識別引擎——天網、基於畫像的新一代智慧內容過濾引擎——天淨、一站式金融風控解決方案——天信、基於海量資料的風險指數服務——天象,全方位解決網際網路內容欺詐和行為欺詐兩大問題。

數美全棧防禦體系之布控體系

對使用者啟動、註冊、登入、業務等行為實施檢測,透過層層行為打分機制為使用者標識風險屬性,在多個環節後確定虛擬機器等使用者並對其實施攔截,既保證正常使用者暢通的產品體驗,又能過濾掉每一個欺詐行為。

數美全棧防禦體系之資料體系

透過將多行業、多場景、多行為之間的風險特徵資料共享,並基於數美構建的核心行為畫像資料優勢,達到全域性風險資料支撐以實現多行業聯防聯控,共同高效對抗網際網路灰產的內容欺詐和行為欺詐。

數美全棧防禦體系之策略體系

透過20多組風險引擎、數萬基礎特徵、數百萬高階特徵、數十萬組高階策略集合的多層、多維度策略,以基礎風險引擎的歷史畫像和實時畫像等行為畫像判斷原始風險,以高階風險引擎分析不同業務場景,對欺詐行為做全域性把控。

數美科技的團隊核心成員來自百度、阿里、騰訊、360、小米等知名網際網路企業,在人工智慧反欺詐領域有著豐富的實踐經驗。作為領先的人工智慧反欺詐服務提供商,數美科技以“資料智慧,美好生活”為使命和願景,依託人工智慧,專注反欺詐,透過構築數美全棧防禦體系,幫助企業客戶在不影響正常使用者產品體驗的同時做到快速、準確地識別欺詐使用者、欺詐行為、違規內容並對其進行實時攔截,解決多場景欺詐問題。目前,數美科技已為中信銀行、今日頭條、小米、愛奇藝、小紅書、58同城、熊貓TV、一點資訊、遊族、蜻蜓FM等1000餘家知名企業提供了可信賴的反欺詐服務。