週六晚上幫寶寶換完尿布後,覺得好累(心情上),突然想起冰箱裏還有一罐啤酒,二話不說,馬上開起來喝。在夏天悶熱的晚上,尤其累了一天之後,喝著冰啤酒,看著小朋友在身上亂爬,真是人生一大享受與成就。

 

喝著喝著,腦袋中突然浮現尿布與啤酒的組合,這不是我現在的情景嗎?哈,我終於體會這二個商品為什麼會被一起購買了?尿布代表著一個沈重但喜悅的負擔,而啤酒則給人苦澀卻暢快的快感,二者真是有異曲同工之妙,難怪它們是爸爸下班回家前的最佳購買組合。

 

不過大概統計作太多了,職業病上身,我同時聯想到,我當天下午在晨晰統計講授的多變量方法好像可以運用上?(詳見http://www.rai-stat.com.tw/ad_con.php?pk=6)。於是立刻開電腦作了個實驗。

 

在多變量的集群分析方法上,為了將個體(如消費者)區隔,必須依個體在指標變項上的表現,計算兩兩之間的距離,再依照距離大小將個體分群。這中間會產生一個叫相異性距陣,代表兩兩個體的距離。我們虛擬一個超市中每個人所購買的物品紀錄,如圖1所示。ID代表每一個消費者,A、B、C代表三種物品,消費者結帳時如購買某種物品以1代表,反之以0代表。接著我操作出相異性矩陣(圖2~3)

 

圖1  虛擬購買紀錄

s1

 

圖2  SPSS操作一

S2

 

 

圖3  SPSS操作二

S3

 

 

由矩陣可以看出,AB的距離最近,代表AB在這十個消費者的購買模式中是最接近的,也可以說二者一同被購買或不被購買的趨向是一致的。這跟我虛擬資料時,特地將AB一起購買的次數增多的結果是一致。

S4    

 

不過,這純粹我突然奇想的試驗,與傳統資料採礦(Data Mining)的關聯分析是否有相同效果,或者純屬雷同。歡迎高手發文切磋。

arrow
arrow
    全站熱搜

    晨晰部落格新站 發表在 痞客邦 留言(0) 人氣()