數據挖掘技術在客戶關系管理中的應用

隨著計算機技術、網絡技術、通信技術和互聯網技術的發展，企業在電子商務中會產生大量的業務數據。如何從豐富的客戶數據中挖掘出有價值的信息，為企業管理者提供有效的決策輔助，是企業真正關心的問題。其中，客戶分類是分析型客戶關系管理的重要功能之壹。通過對客戶進行分類，區分客戶的夏瑤度，針對不同夏瑤水平的客戶制定專門的營銷計劃和客戶關系管理策略，可以幫助企業降低營銷成本，提高利潤和競爭力。客戶還可以從食品行業制定的專項營銷計劃和客戶關系管理策略中獲得合適的交易體驗。數據挖掘是分析型CRM實現其“分析”功能的必要手段，也是實現客戶分類的有效工具。

1客戶關系管理(CRM)

CRM(客戶關系管理)是壹種旨在改善企業與客戶關系的新型管理機制。它實施於企業的營銷、銷售、服務、技術支持等領域，其目標是提供更好、更快的服務來吸引和留住客戶，通過對業務流程的全面管理來降低倉儲業的成本。

在電子商務的環境下，CRM使網站企業能夠更好地滿足客戶的需求，在各個業務環節提供更好的服務，從而使網站企業能夠在這種沒有時間和空間差異的新商業環境下留住現有客戶，發掘潛在客戶。從而提高市場競爭力。同時，CRM可以提供客戶需求、市場分布、反饋信息等重要信息，為企業和業務活動的智能分析提供依據。因此，CRM為企業成功實現電子商務帶來了基礎。

個性化服務是提升競爭力的有力武器，而CRM就是以客戶為中心，為客戶提供最適合的服務。互聯網已經成為實施客戶關系管理應用的理想渠道。記住客戶的名字和他們的喜好，根據不同的客戶提供不同的內容，會大大增加客戶再次光顧的可能性。CRM可以增加客戶忠誠度，提高購買比例，使每個客戶有更多的購買需求和更長的需求，提高客戶滿意度。

2數據挖掘技術

如何分析這些海量數據，發現強有力的工具就是數據挖掘，可以為商業決策提供有價值的信息，使企業獲得利潤。

在分析型CRM系統中，數據挖掘是核心技術。數據挖掘是從大量數據中提取潛在的、有價值的知識、模型或規則的過程。對於企業來說，數據挖掘可以幫助發現業務發展的趨勢，揭示已知的事實，預測未知的結果，幫助企業分析完成任務所需的關鍵因素，從而增加收入，降低成本，使企業處於更加有利的競爭地位。

2.1數據挖掘常用算法

(1)決策樹決策算法。決策樹是壹種類似於流程圖的樹形結構。其中每個內部節點代表壹個屬性測試，每個分支代表壹個測試輸出，每個葉節點代表壹個類或類分布。決策樹算法包括樹的構造和樹的修剪。常見的剪枝方法有兩種:先剪枝，後剪枝。

(2)神經網絡。神經網絡是壹組相互連接的輸入和輸出單元，其中每個連接都有壹個權重。在學習階段，通過調整神經網絡的權值，可以預測輸入樣本的正確類別標簽進行學習。

(3)遺傳算法。遺傳算法根據優勝劣汰的原則，形成由當前群體最適合的規則和這些規則的後代組成的新群體。遺傳算法用於分類和其他優化問題。

(4)粗糙集方法。粗糙集方法的基礎是在給定的訓練數據中建立等價類。它把知識理解為數據的劃分，每個劃分後的集合稱為壹個概念，利用已知的知識庫加工或雕刻不準確或不確定的知識。粗糙集用於特征約簡和相關性分析。

(5)模糊集方法。基於規則的分類系統有壹個缺點:它們對連續屬性有陡峭的截斷。模糊邏輯的引入允許定義“模糊”邊界，這為在高抽象層次上的處理提供了便利。

其他包括貝葉斯網絡、可視化技術、鄰近搜索方法和公式發現。

2.2數據挖掘中常用的分析方法

(1)分類預測。主要用於客戶細分(聚類)處理，如價值客戶群的分類。分類和預測是數據分析的兩種形式，可用於提取描述重要數據類別的模型或預測未來趨勢。數據驗證是壹個兩步過程。在第壹步中，建立模型來描述預定的壹組數據類或概念，並且通過分析具有屬性描述的數據庫元組來構建該模型。第二步，利用模型進行分類。首先，對模型犁的預測精度進行評估。如果模型的精度是可接受的，那麽它可以用於對具有未知類別標簽的數據祖先或對象進行分類。

預測技術主要用於發現客戶未來的行為，比如對客戶流失的分析，用神經網絡的方法學習各類客戶流失前的行為變化，進而預測(預警)有價值客戶可能的流失。預測器構建並使用模型來評估未標記的樣本類，或者評估給定樣本的可能屬性值或值區間。分類和預測具有廣泛的應用，例如信譽確認、醫療診斷、性能預測和購買選擇。分類預測常用的算法有決策樹歸納、貝葉斯分類、貝葉斯網絡、神經網絡、K近鄰分類、遺傳算法、粗糙集和模糊集技術。

(2)聚類分析。聚類是將數據對象分成多個類或簇。同壹個聚類中的對象具有很高的相似性，但聚類中的對象差異很大。聚類分析作為統計學的壹個分支，已經被廣泛研究了多年，現在主要集中在基於距離的聚類分析上。K-means、K-medoids等聚類分析工具也有很多應用。

(3)關聯規則。關聯規則挖掘給定數據集中項目之間的有趣關系。設I = {i1，i2，...im}為壹組項，任務相關數據D為壹組數據庫事務，其中每個事務T為壹組項，使得T包含在I中.關聯規則的形式為A = & gtB的蘊涵，其中A∈I，B∈I，A∩B為空。挖掘關聯規則分為兩步:①找出所有頻繁項集，這些項集的頻率至少與預定義的最小支持數相同。②從頻繁項集生成強關聯規則。這些規則必須滿足最低支持度和最低置信度。

(4)序列模式。序列模式分析類似於關聯規則分析，同樣以挖掘數據項之間的關系為目的，但序列模式分析是數據項在時間維度上的順序關系。例如，客戶可能在購買計算機半年後購買財務分析軟件。

(5)孤立點分析。異常值是測量誤差或固有數據可變性的結果。許多數據挖掘算法試圖最小化離群值的影響或消除它們。在某些情況下，壹個人的噪音可能是另壹個人的信號。孤立點非常有用。離群點挖掘可以描述為:給定壹組n個數據點或對象，以及期望的k個數的離群點，找出與剩余數據顯著不同或不壹致的前k個對象。離群點檢測方法可以分為三類:統計方法、基於距離的方法和基於偏移量的方法。

3應用方法

3.1了解業務

在初始階段，我們側重於了解業務特征，並將其簡化為數據分析的條件和參數。比如零售業，我們的第壹步是了解客戶的購買頻率，購買頻率和每次消費金額是否有明顯的相關性。

3.2數據分析

這壹階段的重點是對現有數據進行規範化。我們發現，在很多行業中，可分析的數據與上面提到的分析目標並不匹配。比如消費者的月收入水平可能和很多購買行為有關，但是原始的數據積累不壹定有這個螳螂數據。解決這個問題的方法是從其他相關數據中推理。比如，通過抽樣調查，我們發現壹次性購買大量衛生紙的客戶月收入水平集中在1000-3000人民幣的水平。如果這個結論基本成立。我們可以從消費習慣推斷，這個月收入水平的客戶占多大比例；另外，根據抽樣調查的方法。在問卷調查的基礎上，推導出整個樣本人群的收入水平曲線。

3.3數據準備

這壹階段的重點是轉換、清理和導入數據，這些數據可能是從多個數據源中提取的，然後組合起來形成壹個數據立方體。對於少量缺失數據，是用均值填充、忽略還是根據已有樣本進行分布，是現階段需要處理的問題之壹。

3.4建模

現在有各種模型方法可用。讓最好的壹個應用到我們應該關註的主要問題上。是現階段的主要任務。比如盈利預測是否要采用回歸法，預測的依據是什麽等。，這些問題需要行業專家和數據分析專家協商達成。

3.5評估和應用

壹個優秀的評價方法是利用不同的時間段，讓系統預測已經發生的消費情況，然後將預測結果與實際情況進行比較，這樣對模型的評價就容易了。完成上述步驟後，大多數分析工具都支持保存和重用已建立的模型。更重要的是，在這個過程中，數據分析的方法和知識應該已經被客戶的市場分析師或決策者所理解。我們不僅提供最終結果，還提供獲得該結果的方法。“要把金針紮在人身上”是TurboCRM咨詢服務和純軟件提供商的區別。

最後，在軟件架構上，分析數據庫和操作數據庫要分開，避免影響操作數據庫的實時響應速度。

4結論

數據挖掘可以將大量客戶分為不同的類別。每個類別的客戶屬性相似，但不同類別的客戶屬性不同。可以給這兩類客戶提供完全不同的服務，提高客戶滿意度。詳細而實用的客戶分類對企業的經營策略大有裨益。