尿布與啤酒的突發奇想 @ 晨晰統計部落格新站（統計、SPSS、BIG DATA討論園地）

週六晚上幫寶寶換完尿布後，覺得好累（心情上），突然想起冰箱裏還有一罐啤酒，二話不說，馬上開起來喝。在夏天悶熱的晚上，尤其累了一天之後，喝著冰啤酒，看著小朋友在身上亂爬，真是人生一大享受與成就。

喝著喝著，腦袋中突然浮現尿布與啤酒的組合，這不是我現在的情景嗎？哈，我終於體會這二個商品為什麼會被一起購買了？尿布代表著一個沈重但喜悅的負擔，而啤酒則給人苦澀卻暢快的快感，二者真是有異曲同工之妙，難怪它們是爸爸下班回家前的最佳購買組合。

不過大概統計作太多了，職業病上身，我同時聯想到，我當天下午在晨晰統計講授的多變量方法好像可以運用上？（詳見http://www.rai-stat.com.tw/ad_con.php?pk=6）。於是立刻開電腦作了個實驗。

在多變量的集群分析方法上，為了將個體（如消費者）區隔，必須依個體在指標變項上的表現，計算兩兩之間的距離，再依照距離大小將個體分群。這中間會產生一個叫相異性距陣，代表兩兩個體的距離。我們虛擬一個超市中每個人所購買的物品紀錄，如圖1所示。ID代表每一個消費者，A、B、C代表三種物品，消費者結帳時如購買某種物品以1代表，反之以0代表。接著我操作出相異性矩陣（圖2~3）。

圖1 虛擬購買紀錄