知識圖譜關鍵技術與應用(中)

二、知識圖譜典型行業應用介紹

知識圖譜實際上在多個行業裡面已經有所應用

了,只是說我們可能沒有直觀的去看到,比如說我們在日常使用的通用搜索引擎,谷歌、百度等等,它背後都是有知識圖譜的在支撐的。

包括聊天機器人,像微軟小冰、公子小白,還有IBM的watson,它們的背後是知識圖譜,包括私人助理,像siri、GoogleNow等等,還有applewatch,甚至智慧家要想和人之間達到一種語音方面的互動,背後必然要理解自然語義,背後都是有知識圖譜在做支撐的。知識圖譜提供了背景知識,可以很好的來去解答人的相關的問題。

知識圖譜關鍵技術與應用(中)

我們再來看一下,對於企業而言是什麼樣的狀況?

首先我們來看一下企業面臨的資料問題或者挑戰嗎?特別是大型的企業,它的應用系統有非常多的資料,這些資料大部分有很多都是非結構化的資料,以word、excelpdf等等格式存在,還一些有郵件,這些資料跟關係資料庫相比佔非常大的一部分,這些資料是非常難以理解的,但是這些資料裡面又蘊藏著非常多的有價值的東西在裡面。

還有一個問題,大型的公司有非常多的系統,然後這些系統的資料之間是互相很多情況下是互相獨立的,是難以融合的資料孤島。資料模式的動態變化也比較困難,資料使用的專業程度比較高(企業裡面的專業領域的資料,產品的資料,技術的文件),所以說很難做行業的智慧問答。

知識圖譜關鍵技術與應用(中)

但是,在企業的業務方面又存在著非常多的相關的需求,比如說業務方面又要求對這些無結構化的文件進行語義理解,要求對這些散落在企業各地的資訊孤島、資料孤島進行關聯的探索,資料的關聯的探索,然後要求對業務支援動態的擴充套件,模式的動態的擴充套件,又要求能夠支援自動的智慧的搜尋和問答。

一方面是我們在資料上面面臨的諸多的這些挑戰,另一方面,在業務方面又有強烈的相關的需求,什麼樣的技術方案能夠很好的來把這兩者對接起來?

目前來看知識圖譜是解決這一類問題,滿足使用者相關需求比較好的方案。

我們來再進來進一步看一下知識圖譜在其它行業的應用。

知識圖譜關鍵技術與應用(中)

(一)金融行業的應用

在金融行業裡面比較典型的就是

風控反欺詐

1.不一致性的檢查

知識圖譜可以進行資訊的不一致性檢查,來確定是不是存在可能的借款人欺詐的風險,比如說第一個圖裡面的借款人甲和乙來自於不同的公司,但是他卻非常詭異地留下了相同的公司的電話號碼,這個時候是稽核人員就要格外留意了,這裡面有可能會存在欺詐的風險。

2.組團欺詐

甲乙丙三個借款人同一天向銀行發起借款,他們是互不相關的人,但是他們留了相同的地址,那這個時候是有可能是組團的欺詐。存在這樣的可能。

3.靜態的異常檢測

它表示的是在某個時間點突然發現圖中的某幾個節點的聯絡異常的緊密,原來可能大家是互相聯絡都比較少、比較鬆散的,突然間有幾個點之間密集的聯絡,也是有可能會出現是欺詐組織。

4.動態的異常檢測

我們來看第二行中間圖,隨著時間的變化,幾個節點之間圖的結構發生明顯的變化,原來可能是比較穩定的,左邊黑色的上三角、下三角,然後中間連線,但過了一段時間之後,它整個圖的結構變成了右邊的這樣結構,此時很可能是異常的關係的變化,也有可能是一個欺詐阻止。

5.客戶關係管理

怎麼樣去做失聯客戶的管理?比如圖中的理事是一個借款的使用者,但是銀行可能現在沒有辦法直接找到他,甚至透過他的直接聯絡人也沒辦法找到他,那這個時候是不是可以再進一步的透過他的二度聯絡人來間接的來找到他。

透過這樣的圖結構是可以快速找到他的二度聯絡人,比如張小三或者是王二,去聯絡他們,嘗試把李四這個人給找到。

(二)輔助信貸稽核和投研分析

知識圖譜關鍵技術與應用(中)

左邊這個實際上是輔助審貸,知識圖譜它會融合多個數據源,從多個維度來維護關聯人員的資訊,來避免資料不全與資料孤島,它把它整合到一個大的網路結構裡面去,藉助知識圖譜的搜尋,稽核人員可以快速的獲取到信貸申請人張三的相關的資訊,比如住址、配偶、就職公司、他的朋友等等。

這個比原來的傳統的方法要到各個不同的散落的資料來源去搜集的效率要快得多,而且能夠從整體上來看到它的相互之間的關聯關係。

第二個圖是用於輔助投研的,知識圖譜它實時能夠實時地串聯起來這個公司相關的公司,比如說供應商的關係、競爭者的關係、客戶的關係、投融資那些關係等等,然後可以快速實時的定位。

中信通訊這家公司前不久被美國政府進行合規性審查,這個時候投研人員透過知識圖譜搜尋之中興通訊這公司的時候,就可以非常快地得到跟中興通訊相關的上下游這些公司,跟它有關聯的子公司、供應商、客戶、競爭對手、合作伙伴等等,這樣就又可以有助於投研人員快速的來做決策。

三. 精準營銷應用

知識圖譜關鍵技術與應用(中)

這個裡面精準營銷,就知識圖譜,能夠知道你的客戶的非常詳細的資訊,包括名字,住址,經常和什麼樣的人進行互動,還認識其它什麼樣的人,網上的行為習慣、行為方式是什麼樣子。

這樣就可以知識圖譜挖掘出更多的使用者的屬性標籤和興趣標籤,以及社會的屬性標籤,基於知識圖譜就可以進行個性化的商品核心活動的推送能夠實現,從而實現精準的營銷。

知識圖譜關鍵技術與應用(中)

四. 知識圖譜在搜尋引擎裡面的應用

最典型的就是在谷歌搜尋引擎裡面應用。谷歌是在2012年率先提出來知識圖譜的概念,提出這個概念的最主要的目的就是用於改善它的搜尋引擎的體驗。

我們從這個圖就可以看到,使用者搜尋的是泰姬陵,泰姬陵是印度的非常著名的,也是世界八大奇蹟之一的景點。

這裡面不一樣的地方是它在搜尋引擎的右側,會以知識卡片的形式來呈現跟泰姬陵相關的結構化的資訊,包括泰姬陵的地圖、圖片、景點的描述、開放時間門票等等,甚至在下面會列出跟泰姬陵相類似或者相關聯的景點,比如中國的萬里長城同樣是世界的幾大奇蹟,包括金字塔等等,這樣的知識點,可以非常好的把知識組織和關聯起來。

同時,它還可以進行知識的擴充套件,比如說泰姬陵不光是印度的景點,它還可以是這個一個音樂專輯,它甚至是國外某城市的街區街道,也叫泰姬陵。

這樣透過知識圖譜可以不斷的去探索發現新的非常新奇的東西,讓使用者在搜尋引擎裡面能夠不斷的去進行知識的關聯的發現,激發起使用者的搜尋的慾望。

原來我們搜尋引擎講究的是說快速的找到它的結果,然後關掉就完了,谷歌透過知識圖譜,實際上是把搜尋引擎變成了知識的探索和發現引擎,這是概念和理念上的非常大的變遷與升級。

知識圖譜關鍵技術與應用(中)

五.知識圖譜應用於推薦系統

我們熟悉比較熟悉的是

個性化推薦

,就是所謂的千人千面,比如根據遊戲來推薦遊戲的道具。

對於小白使用者和骨灰級的使用者,它推薦的東西顯然是不一樣的,這是個性化的推薦。

個性化推薦之外,還有場景化的推薦

,比如使用者購買了沙灘鞋,或者留意的沙灘鞋,使用者他要去旅遊海邊度假這樣場景,有呈現這樣的場景,基於這樣的場景可以繼續給他推薦這游泳衣、防曬霜或者其它的海島旅遊度假的產品。

還有一種是基於任務型的推薦

,比如使用者買了牛肉卷或者羊肉卷,這個時候他實際上是要為了完成一項任務,這項任務就是吃一頓火鍋,對吧?這個時候我可以給他推薦火鍋底料或者是電磁爐等等。

還有一個場景,

推薦系統冷啟動

一直是比較難以處理的問題,通常的做法就是根據新使用者的裝置型別,或者是他當前的時間位置等等,或者外面的關聯資料來做推薦。

對於新的物品的話,我們在知識圖譜這邊的話,我們可能會透過語義的標籤,比如說旅遊和攝影實際上是語義相近的兩個標籤,還有一種比如相同的導演或者相同演員的電影在語義上也是比較相近的,那這個時候也可以做這樣的推薦。

還有一種在推薦方面比較難的就是

跨領域的推薦。

我們我們會看到在微博上面會去推薦淘寶的商品,在新浪微博的資訊流裡面,它是怎麼做的?

新浪微博有些使用者會經常去曬黃山、九寨溝、泰山等這些照片,這個時候我們就知道他有可能是一位登山達人,或者是登山的愛好者,這個時候淘寶就會可以給他推薦登山的裝備,登山杖、登山鞋等等這些裝備,就是知識圖譜利用了這些背景知識,能夠為不同的平臺之間的語義鴻溝來打通。

還有一種是

知識型的推薦

,是基於知識的。

比如清華大學、北京大學都是985的頂級名校,復旦大學也同樣是的,這個時候是可以推薦復旦大學,包括百度、阿里和騰訊,百度、阿里就可以推薦出騰訊,它是屬於BAT的網際網路的公司。

所以之前很多是基於使用者的行為,然後去挖掘出基於行為的推薦,現在有了知識圖譜以後,我們可以從基於行為的推薦,發展到行為跟語義相融合的智慧推薦,就是結合更多的語義方面的互聯互通訊息,再加上使用者的行為資訊,來綜合的做智慧推薦。