一個crm軟件中包含很多不同的技術,不同的技術,控制不同的功能。今天為大家介紹的是模糊數據挖掘如何在crm軟件上應用。
數據挖掘技術概述
數據挖掘是一種知識發現的過程,它主要基于統計學、人工智能、機器學習等技術,從大量的數據中,抽取出潛在的、有價值的知識、模型或規則的過程。高度自動化地分析數據,做出歸納性的推理,從中挖掘出潛在的模式,并對未來情況進行預測,以輔助決策者評估風險,做出正確的決策。對于企業而言,數據挖掘有助于發現業務的趨勢,揭示已知的事實、預測未知的結果,提高市場決策能力。其演化過程如圖 1所示。
然而單純的數據挖掘可能會導致“尖銳邊界”等問題,因此考慮將模糊邏輯和數據挖掘結合起來的模糊數據挖掘技術引人到客戶關系管理系統中。

模糊數據挖掘方法
1 確定模糊集
建立樣本特性指標矩陣,設聚類的對象的全體集合X={x1,x2,…,xn},為了使分類效果科學合理,首先要選取具有實際意義且有較強分辨性和代表性的統計指標。現假設X中每一個元素Xj(j=1,2,…,n。)有m個統計指標Xij= (x1j,x2j,…,xnj),其中,分量Xij表示第j個元素的第i項統計指標值(i=1,2,…,m;j=1,2,…,n)。本步驟的關鍵是統計指標值的求法。統計指標值反映實際的精確程度,是取得最優聚類的先決條件,由于各企業的實際情況不一樣,所選取的統計指標也應各不相同。因此,統計指標值的求法因實際問題而定。
2 對樣本特性指標矩陣進行數據規格化
在實際問題中,通常不同的數據有不同的量綱。因此,需要根據模糊矩陣的要求,進行標準化處理。一般可通過以下變換來實現。
2.1 平移/標準差變換

3 標定— 建立模糊相似矩陣
所謂標定,是指根據實際情況,選用一定的方法對對象進行比較得出模糊相似矩陣。根據上述已建立的指標體系 Xj(j=1,2,…n),求出相似系數rij表示Xi與Xj按m個特征相似的程度,得到模糊相似矩陣R=(rij)mxn本步驟的關鍵是如何合理地求出相似系數rij,由于求相似系數的方法很多,而且需要因實際情況不同而選用不同的方法。
求相似系數的方法很多,主要有最大最小法、算術平均值最小法、幾何平均值最小法、相關系數法、夾角余弦法、距離法、數量積法、絕對值指數法、絕對值倒數法、絕對值減數法等方法。
對于一些實際問題,很難用解析表達式來刻畫事務間的相關程度,這時只有請有經驗者或專家進行評分,用〔0,1〕上的數表示。選取什么樣的方法描述兩個元素之間的相似程度,將直接影響分類的效果。通常是同時選三四種,最后看分類與實際吻合的情況,擇優選取。
4 求傳遞閉包— 構造模糊等價矩陣
用傳遞閉包法求R的模糊等價矩陣。傳遞閉包是包含R的最小傳遞矩陣,設 t(R)是R的傳遞閉包,通常采用平方法求R的傳遞閉包,即R→R2→R4 →Rg →…→R2k經有限次運算后,一定有R2k=R2k+1,于是t(R)=R2k。
5 聚類結果
利用各個需求對該次分類的相對隸屬度數據應用相對類別(級別)特征公式,得到各個部件歸屬各類的相對類別特征值H(r)表,從而獲得了該分類數目下的部件類別劃分結果。
根據擇近原則,判斷該樣本接近哪個模式,從這個模式的整體情況預測其發展結果。
應用模糊數據挖掘實現客戶分類
假定每一個客戶對一類產品的外觀、使用環境功能、可靠性都有各自的要求,那么,對于產品簇建模過程來說,要將這些不同客戶的不同需求轉化為產品的工程指標,并最終轉化為產品的零部件,工作量是非常大的,也是不科學的。所以要對不同客戶的需求進行必要的聚類,通過聚類將產品需求分為不同的簇,同一簇中的產品需求視為相同,不同簇中的產品需求視為相異。這樣就可以減少產品模型的種類,并且使形成的產品種類最大限度地滿足不同客戶的需求。
1構造模糊集
選取樣本為5x5階矩陣。設從外觀、使用環境、產品功能、可靠性、忠誠度5個方面描述對產品的需求,構建模糊集 R如表1所示。

2 關聯矩陣規格化

首先根據各個產品需求在產品中的地位給出其相應的權重(相當于指標對聚類作用的權重)。應用式(1)和式(2)實現規格化,結果如表2所示。
3 求傳遞閉包— 構造模糊等價矩陣
用傳遞閉包法求R的模糊等價矩陣。傳遞閉包是包含R的最小傳遞矩陣,設 t(R)是 R的傳遞閉包,通常采用平方法求R的傳遞閉包,即R→R2→R4 →Rg →…→R2k經有限次運算后,一定有R2k=R2k+1,于是t(R)=R2k。求得最優模糊矩陣。最優模糊矩陣表述的內容是每一個需求對各類別(共有m 個)的相對隸屬度。
4聚類結果
利用各個需求對該次分類的相對隸屬度數據,應用相對類別(級別)特征公式,得到各個部件歸屬各類的相對類別特征值H(r)表,從而獲得了該分類數目下的部件類別劃分結果。應用下述的公式對最優模糊矩陣進行處理。
設分類狀態為1~m,某部件對某正態的相對隸屬度表示為RA1(r)~ RAc(r),即表達了上文的最優模糊矩陣。首先,相對隸屬度滿足歸一化條件:

設狀態變量i以對應的相對隸屬度為權重,其總和

稱為相對狀態特征值或級別特征值。表示了i與H(r)分布列的整體相對特征,因此,H(r)可以作為樣本R對模糊概念或指標Ai歸屬狀態判斷的相對指標,它利用了狀態變量i對全部相對隸屬度信息,使樣本 R的歸屬更為全面和客觀。改變分類的數目m,重復上述步驟,產生新的分類,最終得到針對不同m分類的產品需求聚類結果。當m=3時,最優模糊矩陣如表3所示。

通過對m=3時產品需求聚類分析結果的觀察,可以容易地發現各個需求指標的聚分程度:{R5},{R1,R3}, {R2,R4}。這說明,在考慮客戶需求時,對于忠誠度高的客戶群體,可以將他們的需求作為一類產品類型來重點構建;對于第二種分類,說明應該著重針對產品外觀和產品功能來構建一類產品模型;同理,另外一種產品模型的構建應著重考慮產品的使用環境和產品的可靠性。可以看出,通過這樣的聚類,產品模型的種類減少了,但產品模型覆蓋的客戶需求是完備的。
模糊數據挖掘能夠自動地從數據庫中發掘出新的知識,經過檢驗和驗證,然后返回對用戶有用的結果,而不是根據用戶對事物的假設去檢驗和驗證。它與傳統的數據分析本質的區別是:它是在沒有明確假設的前提下去挖掘信息、發現知識。數據挖掘系統已成功地用于超大型數據庫的知識挖掘。
在信息時代,要充分利用企業的信息資源,從以產品為中心的管理模式轉變為以客戶為中心的管理模式上來,利用模糊數據挖掘技術,分析客戶的特征,探索企業和所對應市場的運營規律,不斷提高企業的經濟效益是企業發展的必由之路。
上一篇:
Web 2.0對于CRM的影響下一篇:
CRM與EFM結合,助你讀懂客戶所想(2008-11-27)