拍拍貸業務數據分析
所提供數據來拍貸真實業務數據,從2015-01-01到2017-01-30的所有信用標的10%sample樣本。數據集包含LC.csv(標的特征表數據)。
1.用戶分析
2.借貸相關業務分析
1.導入數據
2.數據清洗
2.1完整性處理
本數據無重復值,但是在gender/age/province/tags/commentsKeyWords這幾列中有部分缺失值,其中年齡的缺失值較多,數據不太具有代表性。
2.2全面性處理
在4個表中,actionTime、oerderTime都是以時間戳形式存儲,先將時間戳改為日期格式。
2.3唯壹性處理
1.用戶分析
1.1用戶性別分析
從借款用戶群體看,男性居多,無論是用戶數量還是借款金額都是是女性用戶兩倍,但在逾期數量上女性稍高於男性群體。
1.2用戶年齡分析
判斷年齡區間值
對年齡進行細化分組,觀察
25-32歲用戶數量最多,高達50.24%,為主要用戶,另外也表明25-32歲這個年齡段經濟壓力最大
1.3用戶借款區間維度分析
判斷借款金額區間值
觀察金額分布情況
拍拍貸借款人借款金額主要集中在100-10000元區間,超過10萬元的大額借款不足1%。拍拍貸是,針對的目標人群應該是壹般白領以下人群。
進壹步分析100-10000的借款區間各類分布情況
在100-10000借款區間內,49%是借款2000-5000,借款5000元及以下是72%,大部分人群借款在5000元及以下
1.4用戶初始信用等級分析
初始評級主要集中在C、D評級,初始評級不高,可能是由於渠道認證信息不完善導致。
1.5用戶借款期限分析
絕大多數用戶借款期限在5-12月,可以看壹看5-12月每個月的具體情況:
借款期限為6個月和12個月較多,壹方面這可能跟拍拍貸的借貸產品有關,另壹方面也跟用戶的習慣有關系
1.6用戶借款利率分析
96%用戶借貸利率都在16%年利息上,50%的用戶通過拍拍貸獲得貸款的利息都在20%以上,小貸貸款只要還款金額能覆蓋逾期壞賬就是暴利
2借貸相關業務分析
2.1時間維度下的客戶數量、放款金額、逾期率等
隨著用戶量增長,總借款金額也隨著上升,但是在16年11月後,借款金額增長放緩。
平均借貸金額從15年8000-10000到16年3月逐漸穩定在4000元上下,在16年11月平均借貸金額緩慢下降。
月度逾期率在15年12月後維持在15%,但在16年10月開始攀升,到17年1月份約為19%。
2.2逾期率分析
2.2.1逾期類型分析
電商借款類型逾期率相對較高,應引起足夠重視,關註電商客戶經營狀況以及造成逾期的具體原因。
借款類型為APP閃電和普通,這兩類占據逾期用戶群體87%,應關註這兩類客戶使用資金的用途及資金去向。
其他類型是壹個特殊的群體,該類客戶逾期量跟逾期率都是較高的,應關註該類用戶群體深挖原因
2.2.2 初始評級逾期率分析
用戶主要初始評級集中在CD兩種類型,逾期率相對較高,應重點關註評級CD的客群,需要加以輔助手段,降低逾期率水平
(壹)用戶維度分析
1、貸款客戶男性居多,維護並抓住好男性客戶群體
2、平臺客戶貸款年齡主要集中在25-32歲,可以針對該群體特征,有選擇性的進行渠道推廣,與此同時,應關註該類群體逾期率較高問題
3、借款金額範圍應該5000元以下為主要產品,5000-10000為次要產品推廣
4、應該重點關註初始信用等級為C和D的用戶群體,降低這類客戶的逾期率
5、用戶偏好的借款期限在6個月和12個月,但是逾期率較高,9個月的借款量較少,但是逾期率偏低,可以推廣三個季度的借貸產品。
6、拍拍貸借款利率多說超過20%,利率超過16%在96%以上
(二)業務分析
1、隨著用戶量增長,總借款金額也隨著上升,但是在16年11月後,借款金額增長放緩,逾期率卻在上升,應加大了風控措施。
2、平均借貸金額從15年8000-10000到16年3月逐漸穩定在4000元上下,在16年11月平均借貸金額緩慢下降,應收縮借貸金額規模,提高甄別等級。
3、借款類型應可重點推廣APP閃電和普通類型的借款,但是要提高風控水平。電商借款類型,要關註用戶經營狀況。
4、對初始信用評級在C、D的,應多拆出幾個更新維度的信用評級,用於有針對性進行風控,降低逾期率。
微粒貸有多可怕?
微粒貸平臺較大,風險較小,但是對個人信用有壹定影響。
根據網友的說法,微粒貸會在用戶沒有借款的情況下查征信記錄,由此產生的征信查詢記錄可能影響用戶申請其他貸款。
"微粒貸"是國內首家互聯網銀行微眾銀行面向微信用戶和手機QQ用戶推出的純線上小額信用循環消費貸款產品,2015年5月在手機QQ上線,9月在微信上線。
“微粒貸”產品定位為互聯網小額信貸產品,貸款額度在20萬以下,貸款利率低於壹般信用卡利率。
“微粒貸”是通過“白名單”機制篩選出首批最符合“微粒貸”客戶定位用戶,主要在微眾和騰訊內部為主。下壹步,微眾銀行將與QQ錢包壹起,還可以在微信錢包中上線。
用戶只需要綁定過銀行卡,就能壹鍵點擊“借錢”,系統會在幾秒鐘之內判斷個人信用情況,並給出壹定的額度。用戶無需任何抵押物,根據相應提示填寫信息,就能在線完成借款。
用戶只需要手機QQ、微信的“錢包”入口中壹鍵點擊“借錢”,系統就會在幾秒之內判斷個人信用情況,並給出500元至20萬元不等的貸款額度。用戶無需任何抵押物,根據相應提示填寫信息,就能在3分鐘內完成借款。借錢後能夠隨時提前結清,按日計息。
微粒貸已實現線上操作,無需面簽,並實現7×24小時無間斷服務。微粒貸的主要服務對象是個人和個體經營戶。截至2017年末,微粒貸主動授信客戶超1.3億人,累計借款客戶超過1100萬人,筆均貸款僅8200元,貸款人群覆蓋全國31個省區市,567座城市。
除了個人征信情況外,社交數據在我們的評分系統裏占了相當重要的壹部分。無論在微信還是在手Q上的‘微粒貸’,在授信時都會充分參考用戶在整個騰訊體系產品內的數據,重點包括這兩個平臺的社交數據。不過,在不同的渠道上,額度的評判標準會有側重。
比如,手Q上的‘微粒貸’在對用戶設置授信額度時,會更多參考其手Q的活躍程度;而在微信上的‘微粒貸’,則會更多地參考其微信的活躍程度。
中國將近14億的人口,有多少人是負債的?
中國將近14億的人口,有多少人是負債的?
目前國家並沒有關於這個方面的相關數據統計,但是我們可以通過壹些數據來反面倒推有負債的人群有多少人。
人均貸款規模
根據中國人民銀行發布的數據顯示,截止2018末,我國商業銀行的貸款141.75萬億,當然這個貸款中壹大部分都是企事業單位的貸款,境內居民的貸款沒有這麽高。根據2018年度度的統計年鑒,2018年末我國居民貸款規模達到47.9萬億,其中中長期消費貸29.0萬億,占比61%。
中長期貸款29萬億,主要為房貸、裝修貸款等等,房貸的規模壹般金額較大,不過考慮到房貸的還款時間,有的余額高,有的余額低,在結合房貸以外的其他中長期貸款,因此我們取30萬元的均值,那麽大概有:29萬億/30萬元=97萬人。
扣除中長期貸款後,短期貸款還有18.9萬億,短期貸款包括的各類信用貸款、消費貸、信用卡透支等等,這個的金額相對較少,我們取均值5萬元,那麽負債的人數約為:18.9萬億/5萬=3.78億人。
也就是說以商業銀行的貸款余額規模來說,目前有負債的人數大概有,4.8億人,不要覺得少,要知道銀行可貸的年齡壹般是18周歲以上,60周歲以下,扣除老弱病殘幼之後(單60歲以上的2015年就有2.22億人),實際可以貸款的青壯年也就10個億左右,接近有壹半的人群負債。
我國的商品房規模
在中國目前可以實現全款買房的人少之又少,估計占不到總人口的1%,僅2005-2017年,我國商品房銷售面積就已經超過120萬平方米,以平均20年的房貸世間計算,那麽從2000年到2019年之間商品房銷售的面積估計可以超過150萬平方米,按照100平/套計算,那麽***計有:150萬平方米/100平方米=1.5億套,所以單就房貸而言,最少有1.5億人負債。
信用卡及花唄、借唄
花唄沒有最近數據,目前可以查到的是2016年11月,螞蟻金服集團副總裁、網商銀行行長俞勝法對記者采訪時透入的數據:截止2016年11月,開通螞蟻花唄的用戶數已經過億,實際使用的人數也已達近8000萬,要知道花唄是2015年才上線的,所以估計到今年,花唄最少有兩三億的用戶。
銀行的信用卡呢?截至2018年第三季度末,全國銀行卡在用發卡數量73.85億張,環比增長2.75%。其中,借記卡在用發卡數量67.26億張,環比增長2.69%;信用卡和借貸合壹卡在用發卡數量***計6.59億張,環比增長3.36%。全國人均持有銀行卡5.31張,其中,人均持有信用卡0.47張。
信用卡授信總額為14.69萬億元,環比增長5.05%,卡均授信額度2.23萬元,授信使用率74.53%。也就是6.59億張的信用卡,有4.89億張有使用,雖然不排除有的人名下有兩三張的情況,但是綜合起來,信用卡方面最少也有三到四億的使用人群。
其他
其他涉及到的信貸借貸還有很多,比如P2P貸款、民間借貸、各類網貸、汽車金融公司貸款(2017年汽車金融資產規模就在7000億左右了)、還有各類未知的714高炮等等。因為現實中並非人人都可以在銀行借款的,銀行的貸款要求過於嚴格,所以上述非銀行渠道的貸款規模估計也不小,這部分人群我們保守以1個億計算,那麽我國的負債人群應該有6億人左右,扣除老弱病殘幼這些無法貸款的人群,剩余的青壯年負債率估計超過60%。
綜上所述,目前在中國有負債才是正常的,沒有負債反而不正常。有句老話說的好,很多人前半生都在為銀行奮鬥,後半生都在為醫院奮鬥,所以萬達才會從房地產撤離轉移到醫療行業。
大數據觀察:網貸人群分析
大數據觀察:網貸人群分析
把大數據引入P2P網貸,會產生怎樣的“化學反應”?關註P2P的又是什麽樣的人群?他們有著什麽樣的投資習慣?了解這些信息,妳就掌握了開啟P2P網貸行業的鑰匙。
大數據服務提供商GEO集奧聚合近期通過數據挖掘的方式收集了2013年12月1日到31日期間北京、上海、廣東、浙江、江蘇5個地區429個P2P網貸網站的用戶瀏覽數據,樣本量達11906721個,分析了P2P平臺上的貸款人人群和借款人人群屬性、投資習慣等。
經對比分析,GEO集奧聚合得出以下結論:
特征1:陸金所網站的頁面瀏覽量和獨立訪客兩個指標均排名首位;
特征2:排名前三的P2P網站用戶重合度較低,三三重合用戶百分比僅為0.3%,表明目前P2P網站還未到互相爭奪用戶階段;
特征3:用戶主體為30-40歲中青年男性群體;其中商業人士居多,貸款用途多為淘寶經營;
特征4:最受P2P人群關註的投資類產品是股票,最受關註的貸款類產品是銀行信貸,P2P人群與股票人群重合度最高;
特征5:P2P網站的交易量高峰在夜晚,瀏覽量則集中在上午和晚上;
特征6:用戶的平均瀏覽時長近半小時,訪問者對借出的關註明顯高於借入;
特征7:P2P網站重視從搜索、財經類網站導流,貸款人引流詞多為P2P網站品牌名稱,借款人引流詞中貸款類詞匯占1/3;
特征8:貸款人最關註的商品是三星和蘋果手機,借款人最關註服裝鞋帽和華為手機;
特征9:貸款人最關註的奢侈品品牌是香奈兒,借款人最關註是迪奧;
特征10:微信是最受貸款人和借款人關註的社交平臺。
特征數據解讀:
特征1:陸金所目前是國內P2P網貸行業人氣最高的平臺。國資背景以及平安已有商譽為其聚集了越來越多的用戶。可以說,陸金所是目前中國P2P網貸行業的標桿。
特征2:整個P2P網貸行業目前還處於增長期,行業整合尚未開始。隨著近期越來越多的國資背景公司和互聯網行業巨頭開始進軍P2P網貸,行業格局將會進壹步改變。
特征3:使用貸款業務的人群的主要是個體經營戶,而經營活動也主要通過線上渠道進行。可以看出目前網貸服務仍然存在壹定的門檻:1)貸款者通常需要有壹定的互聯網使用技能;2)貸款者通常對於線上支付業務有壹定程度體驗和接受程度。因此,移動客戶端支付的普及將會引入更多的網貸用戶。
特征4:對股票的追捧說明了投資人對風險的承受能力。數據顯示,使用P2P平臺進行投資的人群對於風險的承受能力較高,追求收益的意願較強。在股票收益低迷時期,P2P投資產品為投資者提供了比其它理財形式更高的收益率。但是,當股票市場回暖,P2P行業可能會出現流動性不足。
特征:6:對借出的較高關註度說明P2P平臺用戶投資需求高於借貸。
特征8:貸款人偏愛高端消費品說明貸款人消費能力較強勁,借款人消費能力較弱。
綜述:
目前,P2P平臺的用戶總體中,有投資意願的人群多於有借款需求的人群。這些用戶有較強的投資意願,也同時有較強的風險意識。因此,在對平臺的關註對象選擇時,他們傾向於關註公信力、聲譽較高的品牌平臺。P2P平臺的投資者消費能力較強,對收益的追求傾向也較強。在股市回暖時,P2P行業的整體流動性及穩定性可能受到較大影響。此外,目前P2P平臺對用戶入口仍然存在壹定門檻。移動支付方式的體驗普及和認可度提升可能為P2P行業帶來更多的用戶。
LendingClub貸款數據分析——數據分析(壹)
接上篇
針對 數據集的各個方面進行簡單數據分析。
主要有
先說結論:
將逾期15天以上的貸款視為壞賬,簡化貸款質量
可以看出,壞賬僅有不到8%,但是實際上的金額也是比較驚人的。
2011年後,貸款總額每年都在飆升
可以看出2012年後LendingClub飛速發展,客戶飛速增加,雖然有波動,但總體再增加
各行各業的人都有,居然是老師最多,管理者次之。
工作年限越長越容易貸款嗎,看來是了
這裏將年收入大致分為三個區間
20000以下的視為低年收入,20000-60000視為中等,高於60000的就是高收入人群
大部分客戶年收入都在20000以上
中等人群壞賬數量最多
可以看出人們貸款主要是為了債務整合和信用卡償還,債務整合就是借信用卡還其他信用卡,和信用卡償還貌似沒區別
壹半客戶按揭,四成客戶租房。有房子的不足10%
看來有不良記錄的人很難申請貸款
LC在2012-2015飛速發展,能發的錢越來越多
信用等級越低,貸款利率越高
DTI:每月還款占月收入的比例
大部分的貸款客戶的DTI在35%以下,說明還款壓力不是很大
壹小部分客戶DIT達到45%,存在風險
後續特征工程中將以35%為分界分為兩類
在右側看不見的地方還存在極小壹部分,,基本屬於風險很大的貸款
LC平臺以短期貸款為主,但長期貸款比例也不低
貸款人群數據的介紹就聊到這裏吧。