資深數(shù)據(jù)科學(xué)家告訴你:機(jī)器學(xué)習(xí),如何促進(jìn)互聯(lián)網(wǎng)信貸業(yè)務(wù)增長(zhǎng)
![](http://image.woshipm.com/wp-files/img/81.jpg)
公司的日?;顒?dòng)本質(zhì)上都是為了帶來(lái)業(yè)務(wù)的持續(xù)增長(zhǎng)。為了達(dá)成這一目的,各行各業(yè)的公司采取的方法會(huì)有所不同。今天,我們來(lái)探討一下在大數(shù)據(jù)背景下,蓬勃發(fā)展的消費(fèi)金融行業(yè),如何通過(guò)機(jī)器學(xué)習(xí)的方法實(shí)現(xiàn)業(yè)務(wù)增長(zhǎng)。
消費(fèi)金融行業(yè)天生是一個(gè)數(shù)據(jù)驅(qū)動(dòng)的行業(yè),它往往通過(guò)互聯(lián)網(wǎng)的渠道,非常便捷高效地對(duì)海量的消費(fèi)者提供服務(wù)。從中,用戶(hù)數(shù)據(jù)沉淀了下來(lái)。有了數(shù)據(jù)就有了生產(chǎn)資料,我們才能更好地通過(guò)利用數(shù)據(jù)來(lái)實(shí)現(xiàn)業(yè)務(wù)增長(zhǎng)。而機(jī)器學(xué)習(xí)就是一門(mén)能通過(guò)算法自動(dòng)進(jìn)行數(shù)據(jù)分析和挖掘從而達(dá)成業(yè)務(wù)目標(biāo)的有效技術(shù),它可以滲透到業(yè)務(wù)每個(gè)環(huán)節(jié)并提供針對(duì)業(yè)務(wù)目標(biāo)的不斷優(yōu)化。具體如何來(lái)操作呢?
基本上,對(duì)于一個(gè)業(yè)務(wù)問(wèn)題,我們可以把它拆解為一系列的環(huán)環(huán)相扣的流程節(jié)點(diǎn),當(dāng)每個(gè)節(jié)點(diǎn)的問(wèn)題都得到有效優(yōu)化而解決的時(shí)候,業(yè)務(wù)自然會(huì)增長(zhǎng)。以貸款產(chǎn)品或業(yè)務(wù)為例,我們可以用以下框架來(lái)表述:
這個(gè)框架將一個(gè)貸款業(yè)務(wù)增長(zhǎng)問(wèn)題用一個(gè)數(shù)學(xué)公式表示,即由大盤(pán)用戶(hù)數(shù)、貸款用戶(hù)占比、人均訂單數(shù)、訂單通過(guò)率和單價(jià)五個(gè)環(huán)節(jié)相乘。很明顯,在其它條件不變的情況下,任何一個(gè)環(huán)節(jié)的增長(zhǎng)都會(huì)帶來(lái)最終業(yè)務(wù)收入的增長(zhǎng)。而在這個(gè)框架的背后,則是由大數(shù)據(jù)、機(jī)器學(xué)習(xí)及人工智能等技術(shù)來(lái)支持,進(jìn)而有效的優(yōu)化或解決其中的某些問(wèn)題。
首先,我們要解決產(chǎn)品的獲客或流量來(lái)源問(wèn)題
在互聯(lián)網(wǎng)的背景下,目標(biāo)用戶(hù)來(lái)源通常由自然流量和付費(fèi)流量組成。自然流量通常是通過(guò)用戶(hù)下載了APP、朋友等人的推薦、新聞報(bào)道、渠道合作等途徑而帶來(lái)的。按照增長(zhǎng)黑客的理論,比較理想的效果是產(chǎn)品形成良好的口碑而產(chǎn)生用戶(hù)病毒式傳播,從而帶來(lái)大盤(pán)用戶(hù)爆炸式增長(zhǎng)。
這里要考慮的一個(gè)問(wèn)題是哪些用戶(hù)愿意去分享傳播產(chǎn)品并且能帶來(lái)大量新增用戶(hù)。我們可以基于現(xiàn)有用戶(hù)數(shù)據(jù)用機(jī)器學(xué)習(xí)結(jié)合關(guān)系網(wǎng)絡(luò)圖挖掘算法去解決。
付費(fèi)流量就是通過(guò)互聯(lián)網(wǎng)廣告投放帶來(lái)的。這種流量通常都是掌握在幾家大媒體手里,我們選擇廣告投放的時(shí)候必然要考慮投入產(chǎn)出問(wèn)題,即如何制定合理的投放策略以高性?xún)r(jià)比來(lái)獲取用戶(hù)。機(jī)器學(xué)習(xí)技術(shù)能帶給我們解決方案。
舉個(gè)例子,如果我們通過(guò)搜索廣告平臺(tái)來(lái)獲取用戶(hù),除了創(chuàng)意要考慮外,關(guān)鍵一點(diǎn)在于如何選擇關(guān)鍵詞以及如何為每個(gè)關(guān)鍵詞出價(jià)。關(guān)鍵詞決定了我們能獲取的目標(biāo)人群范圍,基于大數(shù)據(jù),機(jī)器學(xué)習(xí)技術(shù)能高效自動(dòng)幫助我們選出哪些關(guān)鍵詞是我們應(yīng)該考慮的。而在廣告競(jìng)價(jià)過(guò)程中,有預(yù)算限制的前提下,關(guān)鍵詞的出價(jià)則可以用數(shù)學(xué)規(guī)劃或強(qiáng)化學(xué)習(xí)算法來(lái)解決。
第二,我們要考慮貸款用戶(hù)占比問(wèn)題
在一個(gè)產(chǎn)品體系里,可能并非所有的大盤(pán)用戶(hù)都是貸款用戶(hù)。而且貸款是一種低頻行為,部分用戶(hù)不會(huì)一進(jìn)來(lái)就貸款,而是會(huì)在有資金需求的時(shí)候產(chǎn)生借貸行為。因此,我們很有必要精準(zhǔn)識(shí)別出那些真正有資金需求的人群或潛在貸款用戶(hù)。當(dāng)這種人群數(shù)量不斷增加的時(shí)候,總體業(yè)務(wù)也會(huì)隨之持續(xù)增長(zhǎng)。
在人群識(shí)別問(wèn)題上,機(jī)器學(xué)習(xí)技術(shù)是一個(gè)高效的工具。人群識(shí)別往往可以建模為一個(gè)分類(lèi)問(wèn)題,通過(guò)將用戶(hù)的各種數(shù)據(jù)表示成特征,機(jī)器學(xué)習(xí)算法可以高效精準(zhǔn)的識(shí)別出哪些用戶(hù)是需要貸款用戶(hù)。這是當(dāng)今機(jī)器學(xué)習(xí)技術(shù)最成功的應(yīng)用領(lǐng)域-有監(jiān)督學(xué)習(xí),有許多算法可以使用,比如LR,GBDT/XGBoost,隨機(jī)森林等等。
另外,基于用戶(hù)社交網(wǎng)絡(luò)數(shù)據(jù),我們還可以通過(guò)圖計(jì)算挖掘的方式識(shí)別出其中的資金需求群體。針對(duì)這些潛在貸款人群,我們可以通過(guò)運(yùn)營(yíng)活動(dòng)去觸達(dá),促進(jìn)他們成為我們的下單用戶(hù),帶來(lái)業(yè)務(wù)增長(zhǎng)。
第三,我們要考慮如何提高人均訂單量
這里的一個(gè)關(guān)鍵問(wèn)題是如何提升用戶(hù)提交訂單率,這是一個(gè)可以長(zhǎng)期通過(guò)機(jī)器學(xué)習(xí)算法迭代優(yōu)化的指標(biāo)。這主要決定于三方面的要素:用戶(hù)所屬的人群屬性、當(dāng)前在產(chǎn)品上的行為屬性、以及何時(shí)以何種方式何種內(nèi)容觸達(dá)用戶(hù)。
用戶(hù)的人群屬性是指用戶(hù)有無(wú)資金需求,是否費(fèi)率敏感類(lèi)人群,是否重復(fù)貸款類(lèi)人群等等,這些用戶(hù)都可能會(huì)下單。用戶(hù)的行為屬性是要根據(jù)當(dāng)前用戶(hù)在產(chǎn)品的上下文活動(dòng)情況來(lái)判斷其是否會(huì)下單。觸達(dá)用戶(hù)就是要在恰當(dāng)?shù)臅r(shí)機(jī)以恰當(dāng)?shù)姆绞剑ū热缍绦?、push、廣告資源位等)及恰當(dāng)?shù)膬?nèi)容(比如文案、免費(fèi)券、紅包等)傳達(dá)給用戶(hù)從而促成其下單。
在這一環(huán)節(jié),用戶(hù)畫(huà)像系統(tǒng)、推薦系統(tǒng)、自動(dòng)化運(yùn)營(yíng)系統(tǒng)等等將一起配合運(yùn)作高效地發(fā)揮作用,機(jī)器學(xué)習(xí)技術(shù)貫穿始終。通過(guò)這些系統(tǒng),我們還可以建立用戶(hù)響應(yīng)模型來(lái)促進(jìn)用戶(hù)的活躍度,建立用戶(hù)流失預(yù)警模型而減少用戶(hù)流失,建立用戶(hù)LTV模型而提高用戶(hù)留存,這些都將有助于提高用戶(hù)提交訂單量。
第四,我們還要考慮如何提高訂單通過(guò)率
這是金融業(yè)務(wù)的核心環(huán)節(jié)-風(fēng)控,它決定著整個(gè)業(yè)務(wù)能否良性持續(xù)發(fā)展。如果說(shuō)前面幾個(gè)營(yíng)銷(xiāo)環(huán)節(jié)是為了放量,那么風(fēng)控環(huán)節(jié)是為了收,但要有的放矢的收。
風(fēng)控效率的提高將有助于極大提高訂單的通過(guò)率。這里面有兩個(gè)關(guān)鍵問(wèn)題要解決:用戶(hù)的欺詐概率和違約概率預(yù)估,分別對(duì)應(yīng)用戶(hù)的欺詐風(fēng)險(xiǎn)和信用風(fēng)險(xiǎn)。我們要盡力把欺詐風(fēng)險(xiǎn)高或信用風(fēng)險(xiǎn)高的用戶(hù)拒于門(mén)外,把好用戶(hù)放進(jìn)來(lái)。這涉及到如何精確的識(shí)別欺詐概率高的用戶(hù)和違約概率高的用戶(hù)。
在互聯(lián)網(wǎng)金融的環(huán)境里,這些都是比較困難的問(wèn)題。一方面,用戶(hù)貸款是否按時(shí)歸還的反饋周期比較長(zhǎng),通常要一到兩個(gè)月才有表現(xiàn);另一方面,用戶(hù)存在多頭借貸和團(tuán)伙欺詐的行為,這些數(shù)據(jù)往往難以獲?。蛔詈?,經(jīng)過(guò)風(fēng)控系統(tǒng)后,絕大部分用戶(hù)已經(jīng)被拒絕而無(wú)法表現(xiàn)出欺詐或違約,真正有表現(xiàn)的用戶(hù)比例往往可能不足3%,這帶來(lái)了后續(xù)模型建模樣本的有偏性和不平衡性。
基于大數(shù)據(jù)的機(jī)器學(xué)習(xí)技術(shù)將為這些問(wèn)題提供有效的解決方案。機(jī)器學(xué)習(xí)模型的快速迭代機(jī)制有助于減輕反饋周期過(guò)長(zhǎng)問(wèn)題;結(jié)合第三方數(shù)據(jù),應(yīng)用圖計(jì)算技術(shù)將有助于識(shí)別多頭借貸和挖掘欺詐團(tuán)伙;機(jī)器學(xué)習(xí)的半監(jiān)督學(xué)習(xí)算法及針對(duì)樣本不平衡的算法有助于解決樣本有偏及不平衡問(wèn)題。此外,在風(fēng)控的信審環(huán)節(jié),機(jī)器學(xué)習(xí)技術(shù)可以通過(guò)建模預(yù)測(cè)進(jìn)行決策,極大縮短訂單審核時(shí)長(zhǎng),提高用戶(hù)體驗(yàn),促進(jìn)業(yè)務(wù)量增長(zhǎng)。
最后,我們要考慮訂單定價(jià)問(wèn)題,即如何給用戶(hù)定貸款額度和貸款利率
這決定著整個(gè)業(yè)務(wù)的收入及利潤(rùn)。貸款業(yè)務(wù)的定價(jià)本質(zhì)是基于風(fēng)險(xiǎn)的定價(jià),建立風(fēng)險(xiǎn)定價(jià)體系需要綜合考慮經(jīng)營(yíng)成本、目標(biāo)利潤(rùn)率、資金供求關(guān)系、市場(chǎng)利率水平、客戶(hù)風(fēng)險(xiǎn)等因素。
金融學(xué)里對(duì)風(fēng)險(xiǎn)定價(jià)問(wèn)題有一套較完整的數(shù)學(xué)理論描述,我們可以借鑒實(shí)踐。基于大數(shù)據(jù)和機(jī)器學(xué)習(xí)方法進(jìn)行風(fēng)險(xiǎn)定價(jià),我們也可以去探索,目前來(lái)看還是一個(gè)開(kāi)放性研究課題。
總結(jié)
總的來(lái)說(shuō),在這篇文章里,我們建立了一個(gè)業(yè)務(wù)增長(zhǎng)的框架,來(lái)考慮貸款業(yè)務(wù)增長(zhǎng)問(wèn)題。可以看到,在這樣的框架下,基于大數(shù)據(jù)的機(jī)器學(xué)習(xí)技術(shù)發(fā)揮著重要的作用,有助于解決各環(huán)節(jié)遇到的問(wèn)題,不斷地優(yōu)化各種指標(biāo),從而帶來(lái)業(yè)務(wù)的持續(xù)增長(zhǎng)。在后續(xù)的篇章里,我們將會(huì)繼續(xù)分享我們的實(shí)踐,包含圍繞這一增長(zhǎng)框架而生的各種產(chǎn)品、技術(shù)和算法。
本文由 @51智慧金融(微信公眾號(hào)) 翻譯發(fā)布于人人都是產(chǎn)品經(jīng)理。未經(jīng)許可,禁止轉(zhuǎn)載。
題圖來(lái)自PEXELS,基于CC0協(xié)議
我想問(wèn)下,收入的計(jì)算里為什么不將貸后的壞賬占比加上?
歡迎交流和合作,作者微信號(hào)976619964,個(gè)人微信公眾號(hào)(51智慧金融社區(qū))