應用資料探勘於顧客價值預測 -以醫療器材業為例 ·...

25
應用資料探勘於顧客價值預測―以醫療器材業為例 應用資料探勘於顧客價值預測 -以醫療器材業為例 趙景明 楊清潭 東吳大學資訊科學系副教授 世醫股份有限公司資訊處處長 [email protected] [email protected] 摘要 近年來顧客成為企業經營的焦點,顧客關係管理(Customer Relationship Management)的議題受到熱烈的討論與研究。企業投入大量資源增加對顧客的瞭 解並與顧客建立良好關係,希望提高顧客滿意度(Customer Satisfaction)及顧客忠 誠度(Customer Loyalty) ,進而增加所謂的忠實顧客。顧客價值分析(Customer Value Analysis)是顧客關係管理的基礎。對企業而言從顧客所獲得的利益越高, 代表顧客的價值越高。依據 80/20 經營法企業內百之八十的資源用在最 價值的之二十顧客,而用剩下之二十資源用在較低價值之八十 的顧客如此依顧客價值高低區隔顧客,分資源放在照顧高價值的顧客 有助吸引更多高價值的客成為忠實顧客,進而使企業獲得大的經營益。 研究以顧客歷史交易資料進顧客價值分析及預測。 首先採Hughes RFM 分析模型為基礎,傳統 RFM 分析模型,提RFM 屬性個別差異 權重 RFM 屬性轉換空間向量,建立量的顧客價值指標 。解RFM 分析模型因行差異性不同 有效整合單一顧客價值指標題。研究應用資料探勘(Data Mining)類神網路(Artificial Neural Network) 技術 將過去期間的顧客交易資料入源,以目前期間的顧客價值學習 目標,建立顧客價值的預測模型最後際產業的顧客交易資料入顧客價 值的計算及預測,並對分析結果顧客價值的區隔建議。 -- 鍵字:顧客價值RFM 分析模型資料探勘類神網路 PDF created with pdfFactory trial version www.pdffactory.com

Transcript of 應用資料探勘於顧客價值預測 -以醫療器材業為例 ·...

Page 1: 應用資料探勘於顧客價值預測 -以醫療器材業為例 · 2003「商情資料庫分析與建置之研究」成果發表會 壹、緒論 近年來隨著消費市場型態的轉變,行銷方式也有大幅改變。

應用資料探勘於顧客價值預測―以醫療器材業為例

應用資料探勘於顧客價值預測 -以醫療器材業為例

趙景明 楊清潭 東吳大學資訊科學系副教授 世醫股份有限公司資訊處處長

[email protected] [email protected]

摘要

近年來顧客成為企業經營的焦點,顧客關係管理(Customer Relationship

Management)的議題受到熱烈的討論與研究。企業投入大量資源增加對顧客的瞭

解並與顧客建立良好關係,希望提高顧客滿意度(Customer Satisfaction)及顧客忠

誠度(Customer Loyalty),進而增加所謂的忠實顧客。顧客價值分析(Customer

Value Analysis)是顧客關係管理的基礎。對企業而言從顧客所獲得的利益越高,

代表顧客的價值越高。依據 80/20經營法則,將企業內百分之八十的資源用在最

有價值的百分之二十顧客,而用剩下的百分之二十資源用在較低價值百分之八十

的顧客上。如此依顧客價值高低區隔顧客,將大部分資源放在照顧高價值的顧客

上,有助於吸引更多高價值的客戶成為忠實顧客,進而使企業獲得最大的經營效

益。

本研究以顧客歷史交易資料進行顧客價值分析及預測。首先採用 Hughes 提

出 RFM分析模型為基礎,改良傳統 RFM分析模型,提出以 RFM屬性個別差異

為權重,將 RFM屬性轉換成三度空間向量,建立量化的顧客價值指標。解決 RFM

分析模型因行業別的差異性不同,無法有效整合成單一顧客價值指標的問題。此

外,本研究應用資料探勘(Data Mining)中的類神經網路(Artificial Neural Network)

技術,將過去期間的顧客交易資料做為輸入源,以目前期間的顧客價值做為學習

目標,建立顧客價值的預測模型。最後,將實際產業的顧客交易資料導入顧客價

值的計算及預測,並針對分析結果提出顧客價值的區隔建議。

--

關鍵字:顧客價值、RFM分析模型、資料探勘、類神經網路

PDF created with pdfFactory trial version www.pdffactory.com

Page 2: 應用資料探勘於顧客價值預測 -以醫療器材業為例 · 2003「商情資料庫分析與建置之研究」成果發表會 壹、緒論 近年來隨著消費市場型態的轉變,行銷方式也有大幅改變。

2003「商情資料庫分析與建置之研究」成果發表會

壹、緒論

近年來隨著消費市場型態的轉變,行銷方式也有大幅改變。由原來以整體大

眾為行銷對象,逐漸朝向為「關係行銷」(Relationship Marketing) 、「一對一行

銷」(One to One Marketing)及「區隔行銷」(Segment Marketing)。在舊有的行銷

活動中,每一個人的個體性是不存在的,企業往往將整群消費者當作行銷的主體

對象,而不探索單一個體的消費行為,這也就是所謂的「巨行銷」 (Macro

marketing);而「微行銷」(Micro Marketing)的概念是尊重和欣賞每個個體的獨特

性,發展具有利益點(Benefits)的產品或服務,來滿足消費者(周庭銳, 民 89)。

依據 80/20經營法則,將企業內百分之八十的資源用在最有價值的百分之二

十顧客,而用剩下的百分之二十資源用在較低價值的顧客上。如此持續經營,對

於企業貢獻度高的顧客會因受到特殊優惠或精緻的服務而吸引成為忠實顧客,並

可能介紹相近的高價值顧客給公司。而貢獻度不高的顧客因為希望享有更高級的

服務或優惠,而增加消費成為貢獻度高的顧客;或因無法享受高級的服務或優惠

漸漸轉移到競爭廠商。這些貢獻度不高的顧客轉移到競爭廠商對公司是有利的,

一方面降低公司的維持該顧客的支出同時也增加競爭廠商的成本。

在做顧客分類策略時,必須先界定所謂「顧客價值」(Customer Value)。研

究顧客價值的學者很多,主要區別為:一、顧客內心所在乎的價值,又稱為顧客

認知的價值(Keeney, 1992; Parasuraman, 1997; Woodruff, 1997; 閔庭祥, 民 90)。

二、顧客對企業的貢獻價值(Hughes, 1996; Phillip, 2000)。此部份又分為以顧客過

去消費資料,分析顧客對企業的價值,稱為顧客獲利性分析(Customer Profitability

Analysis);及估計顧客目前及未來可能的價值稱為顧客終生價值 (Customer

Lifetime Value)。

本論文的研究目的是建立通用於各行業的顧客價值指標及應用類神經網路

學習顧客價值的變化,做為顧客價值的預測模型。說明如下:

1. 建立可量化的顧客價值指標

目前實務界廣泛使用的 RFM分析模型,由於所關連屬性「交易期間」、「交

易頻率」及「交易金額」為所有交易之共有特徵,因此受到許多學者的研究及企

業的採用。但因行業別的差異,對「交易期間」、「交易頻率」及「交易金額」

有不同的差異重要性,且無法有效量化為單一的顧客價值指標。本研究將提出以

PDF created with pdfFactory trial version www.pdffactory.com

Page 3: 應用資料探勘於顧客價值預測 -以醫療器材業為例 · 2003「商情資料庫分析與建置之研究」成果發表會 壹、緒論 近年來隨著消費市場型態的轉變,行銷方式也有大幅改變。

應用資料探勘於顧客價值預測―以醫療器材業為例

RFM屬性個別差異為權重值,將 RFM屬性轉換成三度空間向量,計算絕對距離

做為顧客價值,建立量化的顧客價值指標。

2. 應用類神經網路建立預測顧客價值變化模型

應用資料探勘技術進行知識發掘的方法中,類神經網路具有自動學習的能

力。應用倒傳遞類神經網路技術,將過去一固定期間的顧客交易資料做為輸入

源,以目前期間的顧客價值做為學習目標。經由學習所得的類神經網路模型,做

為未來顧客價值的預測。最後將產業的顧客交易資料,實際導入顧客價值的計算

及預測,並針對所分析結果提出顧客價值的區隔建議。

本研究架構如下:第二節為文獻探討,敘述資料探勘功能、類神經網路運作

原理及顧客價值相關研究。第三節研究方法,說明資料前置處理、顧客價值計算

及類神經網路運算邏輯。第四節實驗建置及結果分析,實際產業導入顧客價值的

計算及預測,並提出顧客價值的區隔建議。第五節結論及未來研究,總結前述之

研究,並提出未來研究方向。

貳、文獻探討

一、資料探勘(Data Mining)

資料探勘是知識發掘(Knowledge Discovery in Database, KDD)中很關鍵的步

驟,且要重複多次進行最後才能得到有用的知識。依據 Fayyad 及 Smyth(1996)

指出資料探勘技術的主要功能有關聯法則 (Association Rule) 、預測模組

(Predictive Modeling) 、自動群集(Clustering) 、序列分析(Sequence Analysis)等功

能,相關研究請參考(Bwrry and Linoff, 2001; Berson, Smith, and Thearling, 2001;

Chen, Han, and Yu, 1996)。

二、類神經網路(Artificial Neural Network)

人類大腦持續的從外界輸入訊息並處理產生適當的輸出反應。我們大腦有數

十億的神經元(Neurons)相互連接而產生複雜的神經網路(Neural Networks),近幾

年來研究學者應用軟體及硬體,發展出模擬大腦皮層活動,有效發展出所謂人工

智慧(Artificial Intelligence),許多的理論模型最早是由 1950年代 Rosenblatt所提

出。但受到當時真實世界應用的限制,類神經網路經過混沌不明的數十年。直到

倒傳遞類神經網路(Backpropagation Neural Network)的出現,使類神經網路受到

多位學者的重視,而應用在廣泛的領域。包括:預測、分類、識別及工程控制等。

PDF created with pdfFactory trial version www.pdffactory.com

Page 4: 應用資料探勘於顧客價值預測 -以醫療器材業為例 · 2003「商情資料庫分析與建置之研究」成果發表會 壹、緒論 近年來隨著消費市場型態的轉變,行銷方式也有大幅改變。

2003「商情資料庫分析與建置之研究」成果發表會

類神經網路的組成可分為三個部份,包括最小單位的人工神經元、由許多

人工神經元組成的「層」(Layer)及由許多層組成的「網路」(Network)。相關研

究請參考(Bwrry and Linoff, 2001; Chu and Widjaja, 1994; Craven and Shavlik,

1997)。

類神經網路的運作過程可分為兩個階段:

1. 學習階段(Learning)

學習過程中網路輸入訓練資料(Training Data)(通常隨機取 20%~50%的資

料),讓網路計算出相對應的輸出值,並且將輸出值與訓練資料的目標輸出值作

比較。兩者之間的差異值再回饋到網路中,調整類神經網路的連結加權值。經由

重複不斷地(一般會設定最大重複次數)學習之後,類神經網路會漸漸修正連結加

權值而使得輸出值越來越接近目標輸出值。當目標輸出值和輸出值接近到某一範

圍內或達到最大重複次數時,則類神經網路停止學習。在學習階段中同時隨機取

20%的訓練資料做為測試資料(Testing Data),以評估訓練學習效果及學習過程中

是否產生過度訓練(Over Training)的情況。

2. 回想階段(Recalling)

經過學習過程後,將完整資料輸入至類神經網路,網路就會根據學習的結果

計算出這些樣本的輸出值,將這些輸出值與目標輸出值做比較,評估類神經網路

的學習效果。

三、倒傳遞類神經網路(Backpropagation Neural Network)

倒傳遞類神經網路屬於類神經網路中的監督式(Supervised)學習網路,是目前

類神經網路模式中最具代表性,應用最廣的模型。類神經網路是多階層向前連接

式設計,每一個連接點需連接到下一層。圖 1是三層倒傳遞類神經網路架構圖。

其中,

Xi:第 i個輸入層人工神經元的輸入變數。

Hj:第 j個隱藏層神經元的輸出變數。

Yk:第 k個輸出層神經元的輸出變數。

Tk:第 k個對應的目標輸出變數。

Wij:輸入層至隱藏層間連結的權重變數。

Wik:隱藏層至輸出層間連結的權重變數。

PDF created with pdfFactory trial version www.pdffactory.com

Page 5: 應用資料探勘於顧客價值預測 -以醫療器材業為例 · 2003「商情資料庫分析與建置之研究」成果發表會 壹、緒論 近年來隨著消費市場型態的轉變,行銷方式也有大幅改變。

應用資料探勘於顧客價值預測―以醫療器材業為例

倒傳遞類神經網路的學習過程說明如下:

1. 選出多個具代表性的學習資料,將資料轉成輸入向量(一般為 0~1 或-1~+1)

做為網路的輸入變數(X)。

2. 經隱藏層與輸出層的計算,得到網路的輸出變數(Y)。

3. 比較學習資料的目標輸出值(T)與網路之計算輸出值(Y),求出誤差值。

4. 根據誤差值重新調整網路層間的權重值(Wij•Wjk)。

5. 重覆步驟 1 至 4,直到網路的誤差值低於一個可以容忍的範圍或達到最大重

複次數,即表示網路訓練完成。

四、顧客價值(Customer Value)

(一)顧客認知價值

消費者購買商品或服務時心中自有衡量標準,皆期待能夠「物超所值」。也

就是所謂獲得的價值大於所付出的價值。而這所謂「價值」,Zeithaml (1988)認

為價值是顧客對於付出與獲得的知覺態度,這種主觀態度影響消費者對於商品的

整體評價。而 Holbrook(1996)認為價值是相對的偏好,偏好代表喜好、好感或有

力的判斷,表現出的特徵是顧客與公司或商品的互動經驗。Woodruff (1997)則具

體定義顧客價值,認為經由消費的過程顧客對商品的屬性、屬性的表現與結果和

消費的過程中達成顧客想要的目標或目的,所產生的主觀認知。

X1

X2

Xi

H1

H2

Hj-1

Hj

Y1

Y2

Yk

T1

T2

Tk

Wij Wjk

輸入層 隱藏層 輸出層

圖 1 三層倒傳遞類神經網路架構圖

PDF created with pdfFactory trial version www.pdffactory.com

Page 6: 應用資料探勘於顧客價值預測 -以醫療器材業為例 · 2003「商情資料庫分析與建置之研究」成果發表會 壹、緒論 近年來隨著消費市場型態的轉變,行銷方式也有大幅改變。

2003「商情資料庫分析與建置之研究」成果發表會

另外閔庭祥(民 90)指出顧客價值是「顧客從產品或服務中所得到的總價值

(Total Customer Value)」,其中包括產品價值(Product Value) 、服務價值(Service

Value) 、個人價值(Personnel Value)及形象價值(Image Value)等。而對顧客而言

要取得上述產品或服務,顧客必須付出相對成本,其中包括:金錢成本(Monetary

Price)、時間成本(Time Cost) 、精力成本(Energy Cost)及心理成本(Psychic Cost)

等,統稱為顧客成本(Customer Cost)。以上所得的總價值與付出的顧客成本的加

總則是顧客真正所獲得的價值。

由以上可知,顧客認知的價值是非常主觀意識的看法,在某人感受是有價值

的,但另一個人的感受則未必如此。同樣的對於期望也是如此,不同的顧客會有

不同的期望所重視的價值也不相同。雖然顧客對於價值的衡量取決於獲得利益與

支付的成本,但許多抽象的利益在購買過程中,並不會認真考慮商品的利益與成

本,而是依賴商品的企業形象、品牌、商譽等,形成對商品的信任感來簡化購買

選擇的過程。因此有學者提出顧客價值測量模型。

1. 價值焦點思考(Value-Focused Thinking)

價值焦點思考理論由 Keeney(1992)所提出,是由九項價值思考概念所構成,

包括「發掘目標」、「產生方案」、「判斷決策」、「策略思考」、「策略連結」、

「資料蒐集」、「決策整合」、「改善溝通」及「評估方案」,經由目標衡量整

合成顧客價值模型。

2. 顧客價值階層模型(Customer Value Hierarchy Model)

顧客價值階段模型為Woodruff (1997)所提出主要在消費屬性(Attribute)、消

費結果(Consequence)及消費目標(Goal)三個層面,了解顧客期望價值與認知價

值。在顧客價值階層之間,顧客會學習思考有關於產品的特殊屬性與屬性的表

現,當顧客決定購買或使用產品時,會對產品屬性產生期望或偏好,並對期望結

果的經驗,反映使用認知價值到上一層,一直達到階層的最上層。

3. 顧客價值觀測架構

Parasuraman(1997)提出一個更能有效瞭解顧客價值的架構方法。此方法是先

將顧客區分為初次顧客 (First-Time Customers) 、短期顧客 (Short-Term

Customers)、長期顧客(Long-Term Customers)及流失顧客(Lost Customers)四大類

型。Parasuraman 依據一些特殊的產品購買特性,以購買頻率為例,長期顧客就

比短期顧客在購買行為上,有更高的購買次數。

PDF created with pdfFactory trial version www.pdffactory.com

Page 7: 應用資料探勘於顧客價值預測 -以醫療器材業為例 · 2003「商情資料庫分析與建置之研究」成果發表會 壹、緒論 近年來隨著消費市場型態的轉變,行銷方式也有大幅改變。

應用資料探勘於顧客價值預測―以醫療器材業為例

觀察分析這四種類型的顧客資料,將會對發現顧客的認知價值重點是不相

同。分析初次顧客的資料,瞭解初次顧客比長期顧客更專注於產品的消費屬性

上。從短期顧客和長期顧客的消費結果和消費目標資料,可以提供策略去維持顧

客的產品使用經驗和強化公司與顧客間的關係。而流失顧客的部分將可推測顧客

的叛離原因,更可以維持正確顧客的價值認知。

(二)顧客貢獻價值

近年來隨著消費市場型態的轉變,行銷方式也大幅改變,我們可以清楚知道

消費者每個人的貢獻價值是不同的。因此有許多學者以顧客獲利性做為顧客貢獻

價值分析的基礎。企業為了提供產品或服務顧客,針對個人、家庭或其他企業所

產生的成本與從顧客所獲得的利益相較,利益超出成本的部份,即為顧客獲利

性。而 Mulhern(1999)則認為顧客獲利性是組織從個體的顧客身上所獲得的淨

值,以數學模式表達如下:

J

Σ j =1

(P ijt – C ijt)-

K

Σ k =1

mc ikt

CPi =

T

Σ t =1 (1+r)t ,

其中

CPi:顧客 i的顧客獲利性,

P ijt:在 t期間,顧客 i所購買產品 j的價格,

C ijt:在 t期間,顧客 i所購買產品 j的單位成本,

mc ikt:在 t期間,對顧客 i的第 k次變動行銷成本,

r :折現率。

除以上Mulhern所提出數學模式外,尚有不同學者提不同的計算模型,最為

業界使用的 RFM分析模型及可計算終生價值受到相當重視的馬可夫鏈模型,敍

述如下:

1. RFM分析模型(RFM Analysis Model)

依據 Hughes (1996)研究中描述,RFM分析模型在直效行銷(Direct Marketing)

領域中已使用超過 30 年。但由於電腦科技的進步及資料庫系統的成熟應用才使

RFM分析模型在 1990年以來廣泛被使用,成為資料庫行銷(Database Marketing)

中很重要的作用。RFM 分析模型是利用顧客過去的歷史交易記錄,包括最近一

PDF created with pdfFactory trial version www.pdffactory.com

Page 8: 應用資料探勘於顧客價值預測 -以醫療器材業為例 · 2003「商情資料庫分析與建置之研究」成果發表會 壹、緒論 近年來隨著消費市場型態的轉變,行銷方式也有大幅改變。

2003「商情資料庫分析與建置之研究」成果發表會

次的購買日期(Recency)、一段期間內的購買頻率(Frequency)及一段期間內的購買

金額(Monetary)來進行顧客價值的衡量。

RFM 分析模型具有可適用於各個行業的特性,且計算邏輯簡單許多行銷人

員在不需專屬資訊系統輔助下也可進行顧客分析。因此在企業界已使用一段很長

時間。但 RFM 分析模型存在二項問題:一是個別 RFM 屬性針對不同產業有不

同的差異性。例如某些產業對 R 屬性有很好的區隔能力,但對其他產業可能對

FM屬性有較佳的區隔能力,而 RFM分析模型無針對 RFM屬性敏感性的不同,

整合成單一的區隔指標。二是 RFM分析模型不具有預測能力,僅就顧客過去的

歷史交易資料區隔顧客。

2. 馬可夫鏈模型(Markov Chains Model, MCM)

Phillip 及 Robert(2000)提出以馬可夫鏈(Markov Chain)計算顧客終生價值

(Life-time Value, LTV)做為顧客關係管理的參考依據。MCM決策程序是為解決

隨機 (Stochastic)問題的一種方法,此時前後階段間的狀態轉移機率 (State

Transition Probabilities)必須符合馬可夫性質(Markov Property)。所謂馬可夫性質

為「系統在次一階段將轉移至各狀態的機率僅與目前所處的狀態有關,而與之前

如何變成目前狀態的歷史過程無關」。Phillip and Robert認為MCM能夠同時處

理顧客保留(Customer Retention)及顧客遷移(Customer Migration)問題。

馬可夫鏈模型可以有效預測顧客終生價值,但固定消費期間(T)、平均支出

費用(M) 、幣值波動(d) 及顧客的消費機率(Pr)等,在較複雜產業可能無法正確

獲得。

參、研究方法

資料探勘流程多位學者提出各種版本(Fayyad, 1996; Kleissner, 1998; 楊東麟

與洪明傳, 民 90) 內容大同小異各有其特點。本研究歸納整合及加入顧客價值計

算後的研究流程如圖 2所示。資料前置處理是資料探勘中非常重要的步驟,前置

處理直接影響後續資料探勘是否能夠得到預期的結果。圖 3是完整資料前置處理

流程圖。

PDF created with pdfFactory trial version www.pdffactory.com

Page 9: 應用資料探勘於顧客價值預測 -以醫療器材業為例 · 2003「商情資料庫分析與建置之研究」成果發表會 壹、緒論 近年來隨著消費市場型態的轉變,行銷方式也有大幅改變。

應用資料探勘於顧客價值預測―以醫療器材業為例

一、收集顧客歷史交易資料

資料收集是資料探勘的首要工作。足夠、正確的資料內容及品質才能確保後

續的研究得到預期的效果。醫療器材經銷業資料收集內容如下:

營業內容:代理經銷國內外醫療器材及相關耗材等產品。

營業對象:主要以醫療院所及學校健康中心,約佔 80%營業比重,其次是個人零

售約佔 20%營業比重。

資料收集範圍:收集最近四年的顧客歷史交易記錄。以 1999年至 2000年為類神

經網路輸入來源資料,以 2001年至 2002年為訓練的目標資料。

同時為避免個人零售資料,影響團體單位的購買特性,因此只分

析團體單位交易資料。

收集顧客 歷史交易資料

資料前置處理

顧客價值指標

訓練

類神經網路

修改類神經

網路參數 收斂良好? 學習效果?

滙入全部資料

分析結果

圖 2 研究流程圖

顧客歷史交易資料

資料整合轉換過

區隔期間資料

統計 RFM資料

計算 RFM

百分位數

顧客價值指標

圖 3 資料前置處理流程圖

消費金額

變異數分析

PDF created with pdfFactory trial version www.pdffactory.com

Page 10: 應用資料探勘於顧客價值預測 -以醫療器材業為例 · 2003「商情資料庫分析與建置之研究」成果發表會 壹、緒論 近年來隨著消費市場型態的轉變,行銷方式也有大幅改變。

2003「商情資料庫分析與建置之研究」成果發表會

二、資料前置處理

研究目標資料收集完成後,進入資料前置處理。包括「資料整合轉換過濾」、

「區隔期間資料」、「統計 RFM資料」及「計算 RFM百分位數」等步驟。

1. 資料整合轉換過濾

資料整合(Integration):計算顧客價值指標必須以顧客的消費期間為間隔,分別將

基本資料及交易資料整合成單一資料表,以利顧客價值指標的運算,詳細步

驟即為後續的「區隔期間資料」、「統計 RFM 資料」及「計算 RFM 百分

位數」等程序說明如後。

資料轉換(Transformation):某些資料格式不同需轉換為相同格式,如日期格式,

以民國格式日期需統一轉換為西元格式。同時對於日期輸入錯誤,非正確日

期(如月份超過 12,日期超過 31)也同時將其合理化或刪除不列入分析。

資料過濾(Filtering):醫療器材業交易資料包括顧客基本資料、顧客交易資料及顧

客交易明細資料。顧客交易資料內容是某次顧客交易的訂購日期、總金額、

送貨日期、收款日期…等資料。顧客交易明細資料是某次顧客交易的購買項

目、單價及數量等資料。針對後續 RFM屬性分析,只需瞭解每次購買的日

期及總金額,因此顧客交易明細資料將過濾不保留。

2. 區隔期間資料

醫療器材業的區隔期間設定為二年,是因為醫療院所的採購週期大約 1~3

個月不等,而學校健康中心每一學期至少 2~3次的採購,平均是 2~3個月,因此

期間為二年可累計一定次數的採購量。如果二年內無新的採購資料幾乎可以判定

為流失的顧客。

3. 統計 RFM資料

將過去期間及目前期間的交易資料分別計算 RFM數值。例如:某醫療器材

顧客在過去期間有三次交易明細如下:

順序 交易日期 金額 1 1999/05/01 5000 2 2000/02/01 3000 3 2000/12/15 7000

PDF created with pdfFactory trial version www.pdffactory.com

Page 11: 應用資料探勘於顧客價值預測 -以醫療器材業為例 · 2003「商情資料庫分析與建置之研究」成果發表會 壹、緒論 近年來隨著消費市場型態的轉變,行銷方式也有大幅改變。

應用資料探勘於顧客價值預測―以醫療器材業為例

最近購買日期(R):2000/12/15,相距 2000/12/31天數為 16日

2000/12/31-2000/12/15=16(日)

購買頻率(F):3(次)

購買金額(M):5000+3000+7000=15000(元)

4. 計算 RFM的百分位數(Percentile Rank ,PR)

傳統的 RFM 模型將顧客 RFM 的屬性標示為 1~5 的數字,數字愈大代表價

值愈高。這樣清楚的界線區隔顧客等級可能會產生二個顧客 RFM屬性非常接近

只是前後排列的順序剛好在前面,造成不同的顧客價值等級差距。為解決以上明

顯界線造成誤差問題,本研究改採以百分位數的表示法,將個別 RFM屬性的數

值排序,以 0~1之間的數值表示。舉例說明,某顧客 A的 R屬性的 PR為 0.2、

F屬性的 PR為 0.8、M屬性的 PR為 0.7,則以 A(0.2, 0.8, 0.7)代表該顧客 A的顧

客價值向量,如圖 4所示。

三、RFM屬性與消費金額變異數分析

變異數分析(ANsylsis Of VAriance, ANOVA),用以檢定三個或三個以上母體

均值的差異。實驗研究中,很多因素都有可能使研究對象的觀察值產生差異,變

異數分析可用以探討這些使觀察值產生差異的變因。藉由觀察母體均值差異程

度,並配合變異數的分散情形,來判定母體均值間是否有顯著差異,為統計中應

用甚廣的分析方法(周文賢, 民 86)。

本研究以顧客貢獻價值為顧客價值的分析基礎,因此對於 RFM屬性針對消

費金額進行交互作用之多因子變異數分析及 V(顧客價值指標)針對消費金額進行

0.81

0

0.2

1R

F

0.7 1

M

A(0.2,0.8,0.7)

V

圖 4 顧客價值指標概念圖

PDF created with pdfFactory trial version www.pdffactory.com

Page 12: 應用資料探勘於顧客價值預測 -以醫療器材業為例 · 2003「商情資料庫分析與建置之研究」成果發表會 壹、緒論 近年來隨著消費市場型態的轉變,行銷方式也有大幅改變。

2003「商情資料庫分析與建置之研究」成果發表會

單因子變異數分析,以確定是否與消費金額有明顯差異。最後將有明顯差異的屬

性做為類神經網路的輸入源,訓練類神經網路模型。

四、顧客價值指標

傳統 RFM分析模型依據 Hughes(1996)的研究,應用的行業別不同對 RFM屬

性反應的顧客消費程度有不同的影響。例如:直效行銷的行業,R的效果最好,

F其次,而 M最差。但不是所有行業 RFM的重要性都是 R>F>M。因此本研究

提出以獲利性(顧客消費金額)為評量重點,同時加入個別差異的標準差做為權重

值,將 RFM 屬性當成三度空間向量,再計算至原點的歐幾里德距離(Euclidian

Distance)成為顧客價值,距離越長表示顧客價值越高。這顧客價值是相對的,所

以最後再轉換為百分位數,成為顧客價值指標(Customer Value Index),顧客價值

指標越接近“1”表示顧客價值越高,反之越接近“0”表示顧客價值越低。圖 4為顧

客價值指標概念圖。

歐幾里德距離:

V= 222 )()()( MWFWRW mfr ++ , (1)

其中,Wr:R屬性的標準差,

Wf:F屬性的標準差,

Wm:M屬性的標準差,

V:顧客價值。

五、訓練類神經網路

(一)倒傳遞類神經網路運算邏輯

倒傳遞類神經網路由輸入資料經過網路計算得到計算輸出值,將計算值與目

標值比較不斷修改人工神經元權重值參數,直到獲得滿意數值或達到最大循環次

數為止,詳細運算邏輯如下。

1. 假設輸入資料向量陣列

X(P, i)=(Xp,1 , Xp,2 , Xp,3 , , , , , Xp, i) , (2)

其中,P:資料的順序號,

i:輸入點的號碼。

2. 每一個隱藏層或輸出層都由上一層接收完全相似的向量 X。每一個神經單元

依下列公式計算。

Y(P,L,J)=X(P,L-1) W(J,L)+B(J,L), (3)

PDF created with pdfFactory trial version www.pdffactory.com

Page 13: 應用資料探勘於顧客價值預測 -以醫療器材業為例 · 2003「商情資料庫分析與建置之研究」成果發表會 壹、緒論 近年來隨著消費市場型態的轉變,行銷方式也有大幅改變。

應用資料探勘於顧客價值預測―以醫療器材業為例

其中,Y(P,L,J):計算 P資料在 L層 J神經元的結果,

X(P,L-1):L-1層的輸入資料,

W(J,L):L層 J神經元外部的權重值(weight),

B(J,L):L層 J神經元的門檻值。

3. Y(P,L,J)的結果再經過轉換函數(Transfer Function)的運算做為下一層神經元

的輸入,本研究以最常使用的 S型(Sigmoid Function)為轉換函數。

4. 經過轉換函數後的結果做為一下層神經元的輸入。

X(P,L)=(f(Y(P,L,1),f(Y(P,L,2),….,f(Y(P,L,K))), (4)

其中,K:L層中所有的神經元數量。

5. 最後的輸出向量結果為 X(P,O)。

6. 接著計算與學習目標向量 T(P)的誤差值。

E(P,O)=(T(P)-X(P,O)) X’(P,O), (5)

X’(P,O)=(f’(Y(P,O,1),f’(Y(P,O,2),… , f’(Y(P,O,K))), (6)

f’是轉換函數 f的導函數(Derivative)。

針對 L層 J神經元的誤差向量計算公式如下:

E(P,L,J)=X’(P,L,J)*SUMK(E(P,L+1,K)*W(K,L+1,J)), (7)

其中,K:在 L-1層的第 K個神經元。

7. 依據上一步驟所得到的誤差向量,修改權重值。

W(J,L)T+1= W(J,L)T+(eta)SUMP(E(P,L,J)X(P,L-1))

+(alpha)(W(J,L)T-W(J,L)(T-1)), (8)

其中,eta:學習率(Learning Rate),

alpha:動量因子(Momentum Factor),

T:重複循環(Iteration Cycle)。

8. 將所有輸入向量,透過類神經網路並調整權重值,重複所設定次數使誤差向

量縮到最小。

9. 均方根誤差(Root Mean Square Error, RMSE)是計算自訓練輸出值與目標值

之間的誤差程度,數值越小表示模式的預測成效越佳。

RMSE=SQRT(SUMP,K((T(P,K)-X(P,O,K))^2)/(PT*KT)), (9)

其中,P:第 P個輸入資料,

K:第 K個輸出點(node),

PDF created with pdfFactory trial version www.pdffactory.com

Page 14: 應用資料探勘於顧客價值預測 -以醫療器材業為例 · 2003「商情資料庫分析與建置之研究」成果發表會 壹、緒論 近年來隨著消費市場型態的轉變,行銷方式也有大幅改變。

2003「商情資料庫分析與建置之研究」成果發表會

PT:所有 P的總數量,

KT:所有 K的總數量。

重複執行步驟 1至 9重複計算 RMSE,並調整權重值,直到達到設定的訓練次數。

(二)、學習效果評估

倒傳遞神經網路學習效果的評估,可以從 RMSE 的數值變化,監控學習曲

線收斂(Convergence)的情況。而學習率(Learning Rate)的大小直接影響收斂的速

度及收斂的品質。同時過多的隱藏層及人工神經元數量也會影響學習的結果,以

下針對不良學習結果說明如下:

圖 5 200次以上有效收斂圖

1. 無法有效收斂

無法有效收斂的原因有三種情況:

(1) 類神經網路過於複雜

過多的隱藏層或過多的人工神經元數量,使 RMSE無法下降到預期範圍。

(2) 學習率數值太小

太小的學習率影響每次循環修改的權重值變量,在設定的最大學習循環次

數內無法達到收斂效果。

(3) 學習循環次數太小

PDF created with pdfFactory trial version www.pdffactory.com

Page 15: 應用資料探勘於顧客價值預測 -以醫療器材業為例 · 2003「商情資料庫分析與建置之研究」成果發表會 壹、緒論 近年來隨著消費市場型態的轉變,行銷方式也有大幅改變。

應用資料探勘於顧客價值預測―以醫療器材業為例

最大學習循環次數太小,造成未達有收斂時已到學習循環次數。

當類神經網路無法有效收斂,解決方法是「降低類神經網路複雜度」「加大

學習率數值」及「提高最大學習循環次數」。如圖 5所示,學習次數在 200以上

才得到良好收斂。

3. 產生波動(Fluctuate)

RMSE發生波動的原因,有二種:

(1) 學習率數值太大

太大的學習率數值,使每次修改的權重值過大而造成 RMSE 忽大忽小無

法成為平滑曲線。

(2) 學習循環次數過多

過多的學習循環次數,使學習系統在降低訓練資料的 RMSE 數值,卻發

生不穩定現象。

當類神經網路產生波動,解決方法是「減小學習率數值」及「降低學習循環

次數」。如圖 6所示,學習次數在 1500以上產生波動的情況。

圖 6 產生波動圖

4. 過度訓練

過度訓練是由於學習循環次數設定過大,造成類神經網路持續降低訓練資料

的 RMSE,但測試資料的 RMSE 不降反增。表示類神經網路對訓練資料有很好

的學習效果,但測試資料卻效果不佳。這不是我們所樂於見到的,因為將來的真

PDF created with pdfFactory trial version www.pdffactory.com

Page 16: 應用資料探勘於顧客價值預測 -以醫療器材業為例 · 2003「商情資料庫分析與建置之研究」成果發表會 壹、緒論 近年來隨著消費市場型態的轉變,行銷方式也有大幅改變。

2003「商情資料庫分析與建置之研究」成果發表會

實資料也會產生效果不佳的情況。如圖 7 所示,學習次數在 5500 以上,RMSE

不降反增。

圖 7 過度訓練圖

肆、實驗建置及結果分析

本研究以顧客貢獻度為顧客價值衡量基礎,因此針對 RFM屬性,首要步驟

是統計 RFM 屬性的分佈情況及檢定 RFM 屬性與顧客消費金額是否存在顯著性

影響。然後計算 RFM屬性個別標準差做為權重值,計算顧客價值指標。接著將

顧客歷史交易資料隨機取樣 10%~30%為訓練資料及 5~10%的測試資料,做為訓

練類神經網路。最後將所有資料輸入類神經網路評估模型的正確率。

本研究開發工具包括系統開發語言:Microsoft Visual Basic 6.0,資料庫系

統:Microsoft SQL Server 2000,類神經網路開發工具:Vesta Qnet V2000,統計

分析系統:SPSS 10.0.7C。

醫療器材業顧客歷史交易資料中過去期間的顧客數量為 1154 人,交易總金

額 39,320,625元。目前期間顧客數為 1065人,交易總金額 32,172,032元。過去

期間及目前期間同時有消費的顧客為 699人,占目前期間的 65.6%,交易總金額

為 23,846,699元,占目前期間交易總金額的 74.1%。

醫療器材業顧客屬於團體單位顧客,所以顧客數量少但消費金額很大,因此

訓練資料取 30%的數量,測試資料取 10%的數量,做為訓練類神經網路的資料。

PDF created with pdfFactory trial version www.pdffactory.com

Page 17: 應用資料探勘於顧客價值預測 -以醫療器材業為例 · 2003「商情資料庫分析與建置之研究」成果發表會 壹、緒論 近年來隨著消費市場型態的轉變,行銷方式也有大幅改變。

應用資料探勘於顧客價值預測―以醫療器材業為例

輸入屬性共有 4個,過去期間的 R、F、M及 V,而學習目標值為目前期間的顧

客價值指標。

(一) RFM屬性與消費金額的分佈

表 1 醫療器材業 RFM分佈表(過去期間)

R F M 消費金額 比率 消費金額 比率 消費金額 比率

>0.0~<=0.1 1048993 2.7 947286 2.4 126106 0.3 >0.1~<=0.2 2106940 5.4 2123457 5.4 334153 0.8 >0.2~<=0.3 3135585 8.0 1224140 3.1 565180 1.4 >0.3~<=0.4 2354120 6.0 2400473 6.1 860332 2.2 >0.4~<=0.5 3009063 7.7 2280313 5.8 1201020 3.1 >0.5~<=0.6 3342742 8.5 3131326 8.0 1826315 4.6 >0.6~<=0.7 4131613 10.5 3362800 8.6 2715251 6.9 >0.7~<=0.9 4862159 12.4 4373162 11.1 4238335 10.8 >0.8~<=0.9 6909363 17.6 6368551 16.2 7168204 18.2 >0.9~<=1.0 8414748 21.4 12864761 32.7 19599345 49.8 標準差

(百分比) 5.73 8.95 15.10

由表 1得知過去期間(1999~2000)顧客歷史交易資料中,M的標準差(15.10)

大於 F的標準差(8.95)大於 R的標準差(5.73),因此醫療器材業過去期間的 RFM

屬性的差異重要性M>F>R。

表 2 醫療器材業 RFM分佈表(目前期間)

R F M 消費金額 比率 消費金額 比率 消費金額 比率

>0.0~<=0.1 1111031 3.5 1528145 4.7 117564 0.4 >0.1~<=0.2 1711141 5.3 923555 2.9 276256 0.9 >0.2~<=0.3 2365343 7.4 1079105 3.4 416973 1.3 >0.3~<=0.4 2631851 8.2 1530830 4.8 644974 2.0 >0.4~<=0.5 3556805 11.1 2908447 9.0 938149 2.9 >0.5~<=0.6 2857107 8.9 2540468 7.9 1402795 4.4 >0.6~<=0.7 2940214 9.1 2601833 8.1 2239368 7.0 >0.7~<=0.9 5076423 15.8 3661400 11.4 3638910 11.3 >0.8~<=0.9 4659901 14.5 4799734 14.9 5764416 17.9 >0.9~<=1.0 5249732 16.3 10428051 32.4 16086315 50.0 標準差

(百分比) 4.36 8.73 15.16

PDF created with pdfFactory trial version www.pdffactory.com

Page 18: 應用資料探勘於顧客價值預測 -以醫療器材業為例 · 2003「商情資料庫分析與建置之研究」成果發表會 壹、緒論 近年來隨著消費市場型態的轉變,行銷方式也有大幅改變。

2003「商情資料庫分析與建置之研究」成果發表會

由表 2 得知目前期間(2001~2002)顧客歷史交易資料中,M 的標準差(15.16)

大於 F的標準差(8.73)大於 R的標準差(4.36),醫療器材業目前期間的 RFM屬性

的重要性M>F>R,同時可以發現「過去期間」與「目前期間」RFM屬性沒有很

大的改變。

(二) RFM屬性對消費金額變異數分析結果

對於 RFM屬性進行變異數分析,以確定是否與消費金額有明顯影響。採用

有交互影響之多因子變異數分析,檢定最近購買時間、購買次數及購買金額的強

度愈高是否對消費金額貢獻愈大有顯著性影響。

由表3及表4結果顯示,無論過去期間及目前期間,p值小於α值=0.05、R值、

F值、M值三因子交互效果檢定顯著,因此可說明隨著最近購買時間、購買次數

及購買金額的強度愈高對消費金額貢獻愈大有顯著性影響。

(三)顧客價值指標與消費金額的分佈

經過以標準差為權重,將 RFM屬性轉換為三度空間向量,計算所得到的顧

客價值指標與消費金額分佈如表 5所示。其中可得知在過去期間顧客價值最高的

20%的顧客,交易金額佔總金額的 62.7%;而目前期間顧客價值最高的 20%的顧

客,交易金額佔總金額的 63.2%。

表 4 RFM(目前期間)多因子變異數分析檢定

表 3 RFM(過去期間)多因子變異數分析檢定

3.314E+12 489 6776907880 4.624 .0006.876E+11 1 6.876E+11 469.180 .0003.314E+12 489 6776907880 4.624 .0009.731E+11 664 14654819295.627E+12 11544.287E+12 1153

來源校正後的模式

截距

R * F * M值 值 值

誤差

總和

校正後的總數

過去期間醫材交易資料

平方和 自由度 平均平方和 F 檢定 p值

2.755E+12 508 5423971580 6.087 .0006.310E+11 1 6.310E+11 708.146 .0002.755E+12 508 5423971580 6.087 .0004.954E+11 556 8910762184.223E+12 10653.251E+12 1064

來源校正後的模式

截距

R * F * M值 值 值

誤差

總和

校正後的總數

目前期間醫材交易資料

平方和 自由度 平均平方和 F 檢定 p值

PDF created with pdfFactory trial version www.pdffactory.com

Page 19: 應用資料探勘於顧客價值預測 -以醫療器材業為例 · 2003「商情資料庫分析與建置之研究」成果發表會 壹、緒論 近年來隨著消費市場型態的轉變,行銷方式也有大幅改變。

應用資料探勘於顧客價值預測―以醫療器材業為例

分別針對過去期間及目前期間的顧客價值指標與消費金額進行變異數分

析,以確定是否與消費金額有明顯影響。採用單因子變異數分析,檢定顧客價值

指標的強度愈高是否對消費金額貢獻愈大有顯著性影響。由表 6 及表 7 結果顯

示,p值為 0小於 α值=0.05,故可以說明顧客價值指標的強度愈高對消費金額貢

獻愈大。

表 5 顧客價值指標與消費金額的分佈

V(過去期間) V(目前期間) 消費金額 比率 消費金額 比率

>0.0~<=0.1 203295 0.5 198905 0.6 >0.1~<=0.2 462837 1.2 312212 1.0 >0.2~<=0.3 572528 1.5 446694 1.4 >0.3~<=0.4 858308 2.2 684086 2.1 >0.4~<=0.5 1339610 3.4 1095013 3.4 >0.5~<=0.6 1918787 4.9 1702154 5.3 >0.6~<=0.7 3518956 8.9 2639326 8.2 >0.7~<=0.9 5475548 13.9 4246403 13.2 >0.8~<=0.9 8050655 20.5 7334626 22.8 >0.9~<=1.0 16579456 42.2 12998166 40.4

203295 .5% 1767.78 1149.01 1320229.5 115462837 1.2% 4024.67 2096.42 4394992.6 115572528 1.5% 4935.59 2702.89 7305619.3 116858308 2.2% 7463.55 3720.82 13844468 115

1339610 3.4% 11648.78 4831.77 23345965 1151918787 4.9% 16541.27 8564.41 73349057 1163518956 8.9% 30599.62 18621.26 346751307 1155475548 13.9% 47203.00 49664.50 2.467E+09 1168050655 20.5% 70005.70 75356.94 5.679E+09 115

16920101 43.0% 145862.94 101532.06 1.031E+10 11639320625 100.0% 34073.33 60976.36 3.718E+09 1154

V值0->0.10.1->0.20.2->0.30.3->0.40.4->0.50.5->0.60.6->0.70.7->0.80.8->0.90.9->1.0總和

總和 總和的百分比 平均數 標準差 變異數 個數過去期間醫材交易資料

ANOVA 摘要表

2.117E+12 9 2.352E+11 123.980 .0002.170E+12 1144 18970510144.287E+12 1153

V值組間組內總和

平方和 自由度 平均平方和 F檢定 p值

表 6 V(過去期間)單因子變異數分析檢定

PDF created with pdfFactory trial version www.pdffactory.com

Page 20: 應用資料探勘於顧客價值預測 -以醫療器材業為例 · 2003「商情資料庫分析與建置之研究」成果發表會 壹、緒論 近年來隨著消費市場型態的轉變,行銷方式也有大幅改變。

2003「商情資料庫分析與建置之研究」成果發表會

(四)類神經網路學習結果

類神經網路相關參數設定,隱藏層分別由 1至 3層,人工神經元數量由 8至

24個,學習率分別由 0.002至 0.016,以 0.002為間隔。訓練停止設定 RMSE值

小於或等於 0.01,最多訓練次數為 20000次。

表 8 類神經網路學習結果

隱藏層 神經元數量

學習率 Training RMSE

Testing RMSE

Training Correlatiol Remark

0.008 0.253575 0.247063 0.645693 0.01 0.246311 0.222517 0.67068

0.012 0.244704 0.230516 0.676007 0.014 0.243161 0.237669 0.681116 18000以上過度訓練

10

0.016 0.243309 0.235843 0.681738 9000以上過度訓練 0.008 0.244801 0.231652 0.675673 0.01 0.242508 0.238407 0.683142 ※

0.012 0.244651 0.232179 0.676169 0.014 0.239501 0.236194 0.69281 17000以上過度訓練

1

12

0.016 0.24395 0.230999 0.679937 9000以上過度訓練 0.002 0.254586 0.246307 0.642054 0.004 0.25388 0.248223 0.644596

2 10,5

0.006 0.250282 0.240708 0.657223

198905 .6% 1876.46 991.43 982934.613 106312212 1.0% 2945.40 1453.41 2112389.0 106446694 1.4% 4174.71 2489.37 6196966.8 107684086 2.1% 6453.64 2921.75 8536629.1 106

1095013 3.4% 10233.77 5025.46 25255203 1071702154 5.3% 16058.06 9158.31 83874721 1062639326 8.2% 24666.60 15886.15 252369638 1074246403 13.2% 40060.41 34766.34 1.209E+09 1067574626 23.5% 70790.90 77444.12 5.998E+09 107

13272613 41.3% 124043.11 94967.44 9.019E+09 10732172032 100.0% 30208.48 55274.57 3.055E+09 1065

V值0->0.10.1->0.20.2->0.30.3->0.40.4->0.50.5->0.60.6->0.70.7->0.80.8->0.90.9->1.0總和

總和 總和的百分比 平均數 標準差 變異數 個數目前期間醫材交易資料

ANOVA 摘要表

1.492E+12 9 1.658E+11 99.446 .0001.759E+12 1055 16670764493.251E+12 1064

V值組間組內總和

平方和 自由度 平均平方和 F檢定 p值

表 7 V(目前期間)單因子變異數分析檢定

PDF created with pdfFactory trial version www.pdffactory.com

Page 21: 應用資料探勘於顧客價值預測 -以醫療器材業為例 · 2003「商情資料庫分析與建置之研究」成果發表會 壹、緒論 近年來隨著消費市場型態的轉變,行銷方式也有大幅改變。

應用資料探勘於顧客價值預測―以醫療器材業為例

隱藏層 神經元數量

學習率 Training RMSE

Testing RMSE

Training Correlatiol Remark

0.008 0.238013 0.254144 0.697352 12000以上過度訓練

0.01 0.230161 0.25589 0.720828 12000以上產生波動 0.002 0.254337 0.247446 0.642953 0.004 0.250022 0.242343 0.658105 0.006 0.250223 0.241933 0.657422 0.008 0.240744 0.239141 0.688895 15000以上過度訓練

12,6

0.01 0.223614 0.285577 0.740076 6000以上過度訓練

表 8 為不同網路結構及不同學習率的訓練結果,其中在隱藏層數量為 1,人

工神經元數量為 12,學習率 0.01時有最低的 RMSE值及最佳的關聯係數。在部

份學習率加大時產生過度訓練或波動的現象,雖然有更低的 RMSE 值,還是捨

棄不列入考慮。限於篇幅表 8僅列隱藏層 1、2層,人工神經元數量 10至 18個

的學習結果。圖 8為類神經網路參數隱藏層數量為 1、人工神經元數量為 12、學

習率 0.01時,醫療器材業訓練資料之 RMSE趨勢圖。

圖 8 醫療器材業訓練資料之 RMSE趨勢圖

PDF created with pdfFactory trial version www.pdffactory.com

Page 22: 應用資料探勘於顧客價值預測 -以醫療器材業為例 · 2003「商情資料庫分析與建置之研究」成果發表會 壹、緒論 近年來隨著消費市場型態的轉變,行銷方式也有大幅改變。

2003「商情資料庫分析與建置之研究」成果發表會

表 9數據是依據類神經網路參數隱藏層數量為 1、人工神經元數量為 12、學

習率 0.01 時,輸入全部過去期間資料,將運算所得輸出值比對目標值。誤差在

0.05範圍內正確率為 57.80%,誤差在 0.1範圍內正確率為 78.54%。

表 9 類神經網路測試結果

誤差範圍 ±0.05 ±0.1

正確率 57.80% 78.54%

綜合以上顧客價值分析得知,過去期間的顧客價值指標大於 0.7以上的顧客

佔消費總額的 76.6%,目前期間的顧客價值指標大於 0.7以上的顧客佔消費總額

的 76.4%。因此建議醫療器材業將舊顧客維繫資源,著重在顧客價值指標大於 0.7

以上的顧客。而其餘顧客價值指標 0.3~0.7之間的顧客投入一般的維繫資源,最

後顧客價值指標 0.0~0.3之間的顧客可考慮列為放棄顧客,以降低顧客維繫支出。

伍、結論及未來研究

一、結論

依據顧客的價值高低提供不同差異化的服務,企業界已執行多年。由盛傳的

80/20 經營法則到區隔行銷、一對一行銷及關係行銷等,說明顧客是有分類分等

級。如何識別出有價值的顧客及預測未來高價值顧客是所有企業希望獲得的資

訊。

本研究從顧客對公司的貢獻價值,提出以 RFM分析模型的最近交易日期、

交易頻率及交易金額為基礎。首先以變異性分析檢定 RFM屬性與消費總金額是

否呈現顯著差異,結果是顯著。然後增加以 RFM屬性個別標準差為權重值,將

RFM 屬性轉換成三度空間向量,計算絕對距離做為顧客價值。同時所產生的顧

客價值指標經過變異性分析,檢定結果與消費總金額呈現顯著影響。接著應用資

料探勘中的類神經網路技術,將過去期間的顧客交易資料做為輸入源,以目前期

間的顧客價值為學習目標。調整類神經網路模型的相關參數,包括隱藏層數量,

人工神經元數量及學習率,監控學習過程曲線,達到最佳的模型。應用所學習的

類神經網路模型,做為未來顧客價值的預測。

PDF created with pdfFactory trial version www.pdffactory.com

Page 23: 應用資料探勘於顧客價值預測 -以醫療器材業為例 · 2003「商情資料庫分析與建置之研究」成果發表會 壹、緒論 近年來隨著消費市場型態的轉變,行銷方式也有大幅改變。

應用資料探勘於顧客價值預測―以醫療器材業為例

最後將醫療器材經銷業的顧客交易資料,顧客對象主要是團體單位客戶。實

際導入顧客價值指標的計算及顧客價值的預測,並針對所分析結果提出顧客價值

的區隔建議。

二、未來研究

本篇論文中我們提出以 RFM屬性為基礎的顧客價值指標,可通用於各產業

別。但影響顧客重複購買的因素很多。如過去學者所研究包括產品屬性、目的及

使用結果,都會是影響因素。而這些屬性的效能取得需經過問卷調查訪談的方式

才能獲得。同時屬於顧客個人屬性的尚有居住地、年齡、性別、收入…等。其中

居住地經 ANOVA檢定與消費總金額不顯著。年齡及性別在醫療器材業顧客屬於

團體單位,因此無年齡及性別屬性。

類神經網路運算過程前需將相關屬性轉換為 0~1或-1~+1之間的數值表示,

才能讓類神經網路進行學習。因此結合模糊理論之可同時處理數值型及類別型資

料型態的優點,將可提高學習及預測的準確率。

所以在未來我們有以下幾個研究方向:

• 研究顧客個人特徵,增加可能影響消費金額的屬性。

• 研究顧客心理認知層面,對產品屬性、目的及使用結果的滿意度,增加

可能影響消費金額的屬性。

• 結合類神經網路及模糊理論同時處理數值型及類別型資料型態的優

點,提高學習及預測的準確率。

參考文獻

1.周文賢(民 86),統計學。台北:智勝文化事業有限公司。

2.周庭銳(民 89),“顧客價值管理與顧客忠誠度的建立”。電子化企業:經理人

報告,3,21-29。

3.閔庭祥(民 90),「顧客關係管理系統之價值模型建構」,中央大學資管所博

士論文。

4.楊東麟、洪明傳(民 90),“資料探勘在資料倉儲的應用”。資訊與教育雜誌,

8,20-32。

PDF created with pdfFactory trial version www.pdffactory.com

Page 24: 應用資料探勘於顧客價值預測 -以醫療器材業為例 · 2003「商情資料庫分析與建置之研究」成果發表會 壹、緒論 近年來隨著消費市場型態的轉變,行銷方式也有大幅改變。

2003「商情資料庫分析與建置之研究」成果發表會

5.Berson, A., S. Smith and K. Thearling (2001),CRM Data Mining應用系

統建置。台北:美商麥格羅•希爾國際股份有限公司台灣分公司,葉涼川譯。

6.Hughes, A.M. (2001),資料庫行銷實用策略。台北:美商麥格羅•希爾國際

股份有限公司台灣分公司,張倩茜譯。

7.Berry, M.A. and G.S. Linoff (1997), Data Mining Techniques-For

Marketing, Sales, and Customer Support, John Wiley & Sons, Inc.

8.Chen, M.S., J. Han and P.S. Yu (1996), “Data Mining: An Overview from

a Database Perspective,” IEEE Transaction Knowledge and Data

Engineering, 8, 6, 866-883.

9.Chu, C.H. and D. Widjaja (1994), “Neural Network System for Forecasting

Method Selection,” Decision Support System, 12, 13-24, 1994.

10.Craven, M.W. and J.W. Shavlik (1997), “Using Neural Networks for Data

Mining,” Future Generation Computer System, 13, 221-229.

11.Fayyad, U. (1996), “Data Mining and Knowledge Discovery in

Databases,” Communications of the ACM, 39, 11, 22-25.

12.Holbrook, K.B. (1996), “Customer Value-A Framework for Analysis and

Research,” Advance in Consumer Research, 23, 138-142.

13.Hughes, A.M. (1996), “Boosting response with RFM,” Marketing Tools,

5, 4-10.

14.Keeney, R.L. (1992), Value-Focused Thinking, London: Harvard

University Press.

15.Kleissner, C. (1998), “Data Mining for the Enterprise,” in

Proceedings of the 31st Annual Hawaii International Conference On System

Sciences, July, 295-304.

16.Mulhern, F.J. (1999), “Customer Profitability Analysis: Measurement,

Concentration, and Research Directions,” Journal of Interactive

Marketing, 13, 25-40.

17.Parasuraman, A. (1997), “Reflections on Gaining Competitive

Advantage Through Customer Value,” Journal of the Academy of Marketing

Science, February, 154-161.

PDF created with pdfFactory trial version www.pdffactory.com

Page 25: 應用資料探勘於顧客價值預測 -以醫療器材業為例 · 2003「商情資料庫分析與建置之研究」成果發表會 壹、緒論 近年來隨著消費市場型態的轉變,行銷方式也有大幅改變。

應用資料探勘於顧客價值預測―以醫療器材業為例

18.Phillip, E.P. and L.C. Robert (2000), “Modeling Customer

Relationships as Markov Chains,” Journal of Interactive Marketing, 14,

43-55.

19.Woodruff, R.B. (1997), “Customer Value: The Next Source for

Competitive Advantage,” Journal of The Academy of Marketing Science,

25, 139-153.

20.Zeithaml, V.A. (1988), “Consumer Perceptions of Price, Quality, and

Value: A Means-End Model and Synthesis of Evidence,” Journal of

Marketing, 52, 2-22.

PDF created with pdfFactory trial version www.pdffactory.com