close

一直以來,大家對於關聯規則分析(Association)的入門介紹,都僅止於尿布與啤酒一起購買的例子,但實際情況是,老闆對客戶下次買什麼,可能更有興趣。因為普通關聯規則是建基於客戶已經上門,再送上最常見的商品組合,加速成交;但如果客戶根本還沒來,把尿布與啤酒綁在一起,有什麼用呢?

 

所以如果我們可以先猜出下次會買什麼,然後寄相關的產品資料或促銷給他,不是更可以引客戶上門嗎?這就是進階的序列關聯分析Sequential Patterns analysis)。亦即加入時間因素,來推測客戶可能接著會買什麼東西,例如,客戶買了一台腳踏車,可能1個月後會裝車燈,5個月後會換煞車等等。

 

基本上,要作序列關聯分析有個先決條件,必須能追蹤顧客的長期行為,也就是每筆交易記錄都必須有客戶代碼,並且有時間註記或序號決定交易順序。如下面的範例交易資料表,有客戶ID,有同一個月內的交易日期及購買的品項。像第1位消費者共來了四次,每次都至少買二項物品以上。

 

 

Q1

 

序列關聯分析的原理和普通關聯規則僅小有差異,不多作介紹(有興趣可以去看張衡閣2002的論文。但由於軟體XLMiner沒有這個功能,所以改用R軟體來示範。也許一聽到R軟體,可能大家會暈倒。其實不用怕,已經有達人寫出R語法,只要照章執行即可。首先下載R軟體,最新版本R-3.0.1.tar.gzhttp://cran.r-project.org/index.html

 

Q2

 

1:前二列只要執行過一次即可。

 

2support = 0.40代表列出支持度40%以上的序列組合。

 

3:使用的資料檔為zaki.txt,這是安裝"arulesSequences" 套件時,內附的資料檔。一般是在C:\Program Files\R\R-3.0.1\library\arulesSequences\misc路徑下。內容如下圖。

 

 

Q3

 

執行時只要一行一行輸入R 軟體即可,過程不一一介紹。直接看結果,總共找出18個序列,其中第7, 8, 11~18為有時間關係的序列。如第8個序列,先買D,之後會再買BF,支持度有50%,即4個人中有2個會如此;同理第16序列,有50%的人先買BF後,會再買A

 

所以老闆可以考慮,找出已經買D的人,加強促銷BF;或者找出已經買BF的人,加強促銷A。如此,可以有效提高客戶的再購率。

 

相信在一系列的尿布與啤酒的討論文章,可以讓大家對關聯分析有更深的了解,下次與人討論時,不再只是講完尿布與啤酒故事,就沒下文了。

 

Q4  

arrow
arrow
    全站熱搜

    晨晰部落格新站 發表在 痞客邦 留言(0) 人氣()