當前位置:股票大全官網 - 股票投資 - MySQL禮品電子商務用戶行為分析

MySQL禮品電子商務用戶行為分析

項目介紹:使用Kaggle的電子商務數據集。這個數據集是基於某英國禮品電商13個月的真實交易數據。通過對用戶消費行為的分析,建立RFM模型對用戶進行分層,維護高價值用戶,實現精細化用戶運營管理。

負責內容:1。使用SQL語法select/alter/update/create對數據集進行清洗,實現缺失值、異常值和重復值的處理,數據格式的轉換以及清洗後新數據表的建立。

本項目基於英國某電子商務公司2010 12 1至20112 9的真實交易數據集。該電子商務主要銷售各種禮品,其主要客戶是來自不同國家的經銷商。本文主要使用SQL語法分析月度消費趨勢、個人消費情況、RFM用戶分層、用戶生命周期、計算復購率和復購率等關鍵指標,並使用Power BI實現數據可視化。希望從數據中更深入的了解用戶的消費行為,為商業運營提供洞察。

利用數據挖掘用戶消費趨勢,為商家制定營銷策略提供分析和建議,利用RFM模型實現精細化客戶管理。

這部分主要包括刪除無關字段、缺失值檢查、異常值檢查、重復值檢查和日期格式統壹。

* * *處理後有532621條數據。

然後查看數據中是否有缺失值。

上圖顯示有134697客戶代碼缺失,需要和業務確認缺失原因。由於客戶是本次分析的主體,因此缺失的客戶代碼數據被刪除。

清理後的數據***397924。

其中產品數量和訂單時間沒有異常,但是產品單價有異常值0。這類商品可能是贈品,不應該包含在用戶的主動消費行為中,所以刪除。

清理後的數據***397884。

最終清潔後的數據***392690。

將訂單時間列字符串轉換成統壹的sql日期格式,方便用日期函數操作。

預處理按如下方式完成:

從上圖可以看出,從2010年2月到2011年8月,消費金額相對穩定,呈波動上升趨勢;8月份2011開始明顯增加,6月份達到最高值約110+10000,但2月份迅速下降。

從上圖可以看出,產品消費從2011之前的平均35萬件左右波動,從8月開始上升,6月11達到67萬件左右的峰值,2月1回落到30萬件以內。

從上圖可以看出,消費次數普遍大於消費者人數,趨勢基本壹致。2011的8月前,月均消費約1200次,月均消費約900人。兩個變量在8月份開始好轉後,在11達到峰值,消費人數約為2600人,消費人數約為1600人。

從上圖可以看出,人均消費金額普遍大於訂單均價,趨勢基本壹致。小高峰出現在201165438+10月,可能與活動有關。2011二月到2011九月期間比較穩定,分別在450和650元左右。兩個變量的峰值都出現在2011年65438+2月,分別約為850和670元。

從上圖可以看出,超過90%的用戶來自英國,貢獻了近82%的銷售金額。值得壹提的是,查看原始數據發現,荷蘭和愛爾蘭的用戶數量只有12,但消費金額卻排在第二和第三位,占比6%。說明荷蘭和愛爾蘭有大客戶需要關註。另外,只有9個國家的1客戶。建議衡量投入產出比,適當放棄部分地區,集中優勢在英國。進壹步看每個國家的人均訂單量和人均消費。

從上圖可以看出,人均消費TOP5來自愛爾蘭、荷蘭、新加坡、澳大利亞和瑞典。說明這些地區大客戶多,而英國小客戶多。

剔除幾個極大值後,我們發現用戶的消費金額集中在0~500元,約1750用戶,約占40%。

上圖中,橫坐標代表累計用戶數,縱坐標代表累計消費百分比。根據分析,50%的用戶只貢獻了約10%的消費金額,80%的用戶貢獻了約25%的消費金額,也就是說,20%的高價值客戶貢獻了約75%的消費金額,基本符合消費二八定律。所有客戶集中精力拓展與這20%高價值客戶的合作,比分散精力更值得。排名4000後的300多用戶(小於10%)貢獻了60%左右的消費金額,是最需要維護的客戶。

從上圖可以看出,用戶首次購買時間集中在2010的6月上半月,日均在50人以上。從2011到1,首次購買人數保持穩定,日均約15。可能在10,12的時候,因為電商的新成立,引流期引入了大量的新用戶,但是之後新用戶的流入減少了。後續新用戶能保持壹定水平,這是穩定的表現。

從上圖可以看出,2010年2月到2011年9月,用戶最後壹次購買量穩定在15人左右;但從9月份開始大幅上升,2月份最高值為100+人。時間越長,失去壹部分用戶越正常。大量新用戶前期沒有出現較大的流失,大量用戶的最後壹次購買集中在最後壹個統計日期,說明大部分用戶在近三個月內有購買記錄且仍處於主動購買狀態,引入後也沒有快速流失,比較理想。

從上圖可以看出,2010年2月到2011年6月,新增用戶占比持續下降,用戶流失風險較高;直到7月2011,原因可以和業務人員確認,7-2月趨於穩定,基本維持在25%左右。

RFM模型包含三個關鍵維度,即新近性、頻率和貨幣性。利用這三個維度對用戶進行分類,可以將用戶分為2x2 = 8種類型,然後根據每種類型用戶的消費特點進行精細化運營。

接下來依次求R,F,M的值。

RFM模型大概有兩種評分方式,1。選擇要評分的分位數。2.根據行業和業務經驗設定門檻。這裏選擇分位數法,由於SQL不方便RFM評分,所以用python計算分位數。

通過pd.cut的方法,對用戶進行分層和標簽化。我在這裏使用的分層方法是python中的分位數函數。

分別給R,F,M打分(分層)。

接下來求R,F,M的平均值,將每個變量分成兩個維度(平均值為1,平均值為0)。

生成用戶層次表

從上圖分析發現,重要價值客戶最多,占總數的35.73%;總的來說是好的情況,因為這類客戶的價值最高,要努力提高這類客戶的滿意度,增加留存。其次是流失客戶21.99%,新增客戶14.91%,重要客戶8.78%,重要客戶7.98%,重要客戶7.51%。此外,不難看出,21.99%的近壹年交易都是處於流失邊緣的客戶。為什麽會丟失?哪些地區排水比較嚴重?流失客戶的特征是什麽?都是需要註意的問題。

從上圖可以看出,貢獻金額和訂單數最高的是重要客戶,金額690萬,訂單數1550遠超其他客戶。重要召回客戶貢獻排名第二,60萬元。這類客戶都是高頻高價值用戶,恢復他們的購買可以帶來可觀的收益。虧損原因需要結合業務情況和訂單情況進壹步研究。

流失客戶和新客戶表現為訂單高消費低,說明很多新客戶是優惠活動引進的,而流失用戶可能包括部分羊毛用戶。

條形圖根據消費者數量排序。壹般來說,重要價值客戶的比例維持在四分之壹到二分之壹,活躍客戶群相對穩定。維護這樣的客戶可以提供VIP待遇,提升用戶滿意度。

英國應該註意大量流失的顧客。對於這個國家,可以采取維護重要價值客戶的策略,找出客戶流失的原因,減少從重要挽回到流失用戶的轉化。對於德國來說,留住客戶是第二重要的事情,留住客戶有很高的流失風險。要主動聯系用戶並明確流失原因,激活用戶再次購物。同時,加大新客戶的引進。法國的情況與英國基本相同。

重要價值客戶(111)以留住他們為目標,可以提供特色客戶服務和個性化增值服務。

重要回撥客戶(011)旨在回撥近期消費,可以發起活動,精準提供所需資源,推送消息召回。

重要發展客戶(101)以增加消費頻次為目的,可以推薦其他產品,提供積分計劃或日常任務等。

重要客戶留存(001)的目標是讓他們再次回歸消費,了解他們不繼續購買的原因。可以電話或短信聯系,調查原因,彌補不足。

新客戶(100)的目標是增加其消費興趣,可以通過活動營銷、提供社群互動、砍價等策略留住用戶。

壹般客戶(010)屬於容易流失的群體,壹般維持。可以用贈送優惠券、推廣活動信息等方法重新與客戶建立聯系。

潛在客戶(110)旨在挖掘其消費潛力,可以推薦更多價值更高、用戶偏好更高的產品。

流失客戶(000)大概率不是目標客戶,可以選擇性放棄。

用戶生命周期分布受壹次性購買用戶影響嚴重(用戶生命周期為0天),因此壹次性購買用戶(* * *有1548,占比36%)排除在重劃之外。

總體來看,用戶平均生命周期為131天,中位數為93天。最大值為373天,最小值為0天。

回購率:單位時間內買入超過1的人數占當月買入總人數的比例。

復購率:單位時間內已購買的用戶數與下壹單位時間內已購買的用戶數的比值。

(由於6月2011的數據只有9天,考慮到可能影響整體結果,排除6月2011、6月1、2月1的回購利率。

從上圖可以看出,月均回購率為23%。按照精益數據分析中的理論,這家電商公司目前處於混合用戶模式,精力和資源要平均分配在新用戶的轉化和老用戶的留存和復購上。前期復購率低可能是因為推廣初期大量新用戶湧入,導致分母持續擴大。

從上圖可以看出,未來壹個月的平均回購率已經達到39%,總體維持在較好的水平。電商的復購率和復購率越高,消費者對品牌的忠誠度越高。

消費金額和數量:2010年2月至20110年8月相對穩定,呈波動上升趨勢。8月份2011開始明顯增加,6月份達到最高值11,2月份快速回落。

消費次數和人數:消費次數壹般大於消費人數,趨勢基本壹致。2011的8月前,月均消費約1200次,月均消費約900人。兩個變量在8月份開始好轉後,在11達到峰值,消費人數約為2600人,消費人數約為1600人。

地域分析:發現90%以上的用戶來自英國,貢獻了近82%的銷售金額。但是荷蘭和愛爾蘭有大客戶需要關註。9個國家只有1客戶,建議衡量投入產出比,適當放棄。

累計消費金額分析:累計金額曲線顯示,20%的高價值客戶貢獻了75%左右的金額,基本符合消費28規律。所有客戶集中精力拓展與這20%高價值客戶的合作,比分散精力更值得。

首購末購分析:用戶首購時間集中在6月上旬,2010,日均50人以上;從2011到1,首次購買人數保持穩定,日均約15。2010,65438+2月至2011,最後壹次購買用戶穩定在15人左右;但從9月份開始大幅上升,2月份最高值為100+人。

新老用戶分析:2010年2月至2011年6月,新增用戶占比持續下降,用戶流失風險高;7月份有所回升,2011,7-6月份穩定,12,基本維持在25%左右。

數量、金額、人數分析:八類客戶中,重要價值客戶的訂單數量、消費金額、人數排名第壹;重要回撥客戶消費金額排名第二,但訂單量和人數滯後;流失客戶數和訂單數排名第二,但消費金額僅排名第五。

區域分析:總體來看,重要價值客戶占比維持在四分之壹到二分之壹,活躍客戶群相對穩定。英國應該註意大量流失的顧客。對於這個國家,可以采取維護重要價值客戶的策略,找出客戶流失的原因,減少從重要挽回到流失用戶的轉化。對於德國來說,留住客戶是第二重要的事情,留住客戶有很高的流失風險。要主動聯系用戶並明確流失原因,激活用戶再次購物。同時,加大新客戶的引進。法國的情況與英國基本相同。

營銷策略:

重要價值客戶(111)以留住他們為目標,可以提供特色客戶服務和個性化增值服務。

重要回撥客戶(011)目標是回撥近期消費。可以聯系召回(推送、郵件、微信官方賬號等。)並贈送優惠券。

重要發展客戶(101)以增加消費頻次為目的,可以推薦其他產品,提供積分計劃或日常任務等。

重要客戶留存(001)的目標是讓他們再次回歸消費,了解他們不繼續購買的原因。可以電話或短信聯系,調查原因,彌補不足。

新客戶(100)的目標是增加其消費興趣,可以通過活動營銷、提供社群互動、砍價等策略留住用戶。

壹般客戶(010)屬於容易流失的群體,壹般維持。可以用贈送優惠券、推廣活動信息等方法重新與客戶建立聯系。

潛在客戶(110)旨在挖掘其消費潛力,可以推薦更多價值更高、用戶偏好更高的產品。

流失客戶(000)大概率不是目標客戶,可以選擇性放棄。

壹次性用戶占36%。剔除這部分後,用戶的平均生命周期為131天,中位數為93天。最大值為373天,最小值為0天。

回購率:月均回購率23%。按照精益數據分析中的理論,這家電商公司目前處於混合用戶模式,精力和資源要平均分配在新用戶的轉化和老用戶的留存和復購上。前期復購率低可能是因為推廣初期大量新用戶湧入,導致分母持續擴大。

回購率:次月平均回購率達到39%,整體保持在較好水平。電商的復購率和復購率越高,消費者對品牌的忠誠度越高。