電影院相信是大家擁有美好回憶的地方,在黑漆漆的大廳裡躺在超舒服的沙發

上,享受 一兩 個小時的「神遊」。在這小段時間裡,讓人彷彿可以忘卻現實

中一切的壓力與不愉快,跟隨電影主角一起冒險、搞笑或悲傷,看電影好像變

21世紀的一種心理治療方法,讓人不斷想要複製這樣美好的經驗。

 

一定很多人跟筆者一樣是愛看電影一族,筆者一年大約要看30部電影,由於常

常看電影,所以也越來越「關心」電影。有一個不錯的網站介紹給大家(相信

很多人也知道),就是開眼電影網~http://www.atmovies.com.tw/home/,我

常上這一個網站主要的原因是:該網站對於「哪家電影院幾點幾分播放哪些電

影」的訊息記錄非常清楚可靠。所以要出發去看電影之前,必定會先上去瀏覽

一下。

 

常常上去「開眼」瀏覽,筆者發現這個網站裡還有許多關於電影的其他資訊,

例如台北票房狀況、該電影的推薦人數、該電影的評價分數、電影背景資料

(演員、導演、出品公司等)、以及BBS電影討論區。由於經年累月下來,

這些電影資訊其實已經變成一個小小的資料庫了,於是筆者突發奇想,想利用

這些資料做一些簡單的統計分析,看看可不可以獲得一些有趣的新資訊。

 

註:「台灣票房」就是開眼網站裡面有記錄的台灣票房數字;「美國票房」是YAHOO電影

英文版網站上記錄的美國票房數字;「推薦人數」是指開眼網站上推薦這部電影的人數;

「開眼電影評價」是開眼網站上根據網友給分的電影評價平均分數;「YAHOO電影評價」

是台灣YAHOO電影網站上面,網友評價的平均分數;「外國YAHOO評價」是YAHOO電影英文

版網站上,網友評價的分數;「主角的熱門程度」是把主角的姓名用GOOGLE工具,計算出

來的搜尋數量,用這個指標當做是主角的熱門程度;「電影種類」是依據電影內容分類成

動作片、劇情片、喜劇片。

 

 

 

 

『資料蒐集』

筆者首先進行收集資料的工作(這邊的資料蒐集是以可及性為主,網路上立刻

可以查到的資料優先使用),並且把資料整理成可以分析的型態(如上圖)。

當把所有想要分析與了解的變數做成這樣一行一行的資料,就算是初步準備好

了,可以開始進行後續的分析工作。所有的變項裡面除了「電影種類」是類別

變項以外,其他的都是連續變項,如果在表格中有空白的部份,表示是遺漏

值,分析時會自動去除。

 

『假想問題與回答問題』

 

假想問題1.『在美國賣座的電影,在台灣也會賣座嗎?』

筆者一直以來都很好奇,一部電影在美國上映後若票房反應熱烈,是否在台灣

上映也會是如此呢?這個問題應該很多台灣電影代理商會關心,到底要代理哪

一部電影才會大賺錢?是否選擇美國票房好的電影來代理就是「穩賺」的呢?

 

 

回答問題1

筆者把這兩個變項做一個相關分析(Correlation Analysis),結果發現相關程

度為高正相關r=0.75,並且統計上有達顯著水準。這個意思就是說:如果依照

美國票房來推測台灣票房是有高度的準確性的,注意!並非百分之百準確喔,

還是有例外的狀況,但是已經是一個不錯的指標了!

 

假想問題2.『各種不同的評價是否一致?』

很多網站上都會有網友投票的評價分數,但是這些評價分數之間到底關係為何

呢?會不會同樣一部電影在不同網站上的評價差異很大?根本沒有一致性可

言,若是這樣,那想要參考網友評價的消費者可就得大傷腦筋囉!

 

回答問題2.

筆者把這三個變項(開眼、YAHOO電影台灣、YAHOO電影英文版)都一起做相關

分析,結果發現三個評價的網站彼此之間的相關在0.43-0.73之間,算是中程

度的相關,並且統計上都有達顯著水準。由於這三個指標是測量一樣的東西,

邏輯上應該要有非常高的正相關才對(至少要0.8以上),這樣的結果表示一

部電影在不同網站評價分數上可能會有差異,所以精明的消費者還是多參考幾

個網站的評價再決定要不要掏出荷包裡的錢吧!

 

 

 

假想問題3.『哪一種指標最能預測台灣電影的票房?』

這個問題是「超」重要的,我們手上找到許多指標,但是哪一種對票房預測最

有幫助呢?在這裡篩選三種跟台灣票房比較有關連的指標,分別是:開眼網站

的推薦人數、開眼電影的評價、與主角熱門程度,看看統計分析結果可以發現

些什麼?

 

回答問題3.

由於筆者一開始是想針對開眼電影網站裡的數據做應用,因此這邊選取的變項

以開眼電影網站上有的為主。這邊把「台灣票房」當做是依變項,「推薦人

數」、「開眼電影的評價」、與「主角熱門程度」三個當做是自變項,進行多

元迴歸分析(Multiple Regression Analysis)。結果發現只有「推薦人數」這

個變項對台灣票房有高度的預測力,其他兩個變項似乎都無法預測「台灣票

房」的表現。綜合問題二與問題三的結果,筆者推論:開眼網站的電影評價不

太具有參考意義(可能是該網站評價人數不夠多,所以評價的結果有待商榷)

其次電影主角火紅不火紅,無法預測台灣電影票房的好壞,故電影代理商若想

要選大牌演的電影來代理,也不見得就會大賣。至於「推薦人數」對台灣票房

有高度預測性,這一點是可以確定,但是要特別注意:在這裡只是做應用統計

的示範,並非嚴謹的研究(如果正式的研究應該在蒐集變數的時候就先去除可

能有問題的變項)。嚴謹的來說,推薦人數多未必是台灣票房好的「因」,而

且更可能是「果」。畢竟票房好,看過的人更多,自然推薦人數多,所以這樣

的結果不要太開心!參考參考就好了~

 

 

假想問題4.『不同類型的電影在台灣和美國的票房是否有差異?』

電影類型在這邊分作三種(當然細分的話應該更多),這三種類型的電影是否

在票房上有差異呢?還有在台灣票房與美國票房的差異是否一樣呢?(說不定

台灣人愛看動作片,美國然偏愛看劇情片)

 

回答問題4.

在這裡以電影種類為自變項,台灣與美國票房為依變項,做兩個單因子變異數

分析(One-Way ANOVA),結果發現在美國票房上,不同類型的電影票房差異不

顯著,但是在台灣的票房上,動作類的電影顯著的比劇情類的電影票房好,所

以台灣的觀眾偏好看動作類的電影,大家可要加強進攻囉!!

 

『結語』

以上的討論是純興趣的討論,若要做更嚴謹的研究可能樣本數要更多,指標選

擇上要更精確才行。生活周遭其實有許多有趣的資料,鼓勵大家可以隨手整理

整理做些統計分析,說不定可以發現你從來沒發現到的『新世界』!統計真的

好有趣,跟抽象畫一樣,看懂了就愛不釋手~

 
arrow
arrow
    全站熱搜
    創作者介紹
    創作者 晨晰部落格新站 的頭像
    晨晰部落格新站

    晨晰統計部落格新站(統計、SPSS、BIG DATA討論園地)

    晨晰部落格新站 發表在 痞客邦 留言(0) 人氣()