大數據是甚麼?可以吃嗎? 跟旅遊產業有甚麼關係?

大數據是甚麼?可以吃嗎?

大數據 (Big Data 或 Megadata) 原本是指人工無法分析的龐大資料量,必須透過電腦來擷取、管理及處理,以轉換為人類所能判讀的資訊。近年來這個名詞逐漸與資料探勘 (Data Mining) 結合,用來描述透過電腦量化分析,將巨量數據轉換為有用資訊的行為。

單單這樣講似乎十分死板模糊,舉個具體一點的例子,想像你現在正在牌桌前賭 21 點 (小賭怡情大賭傷神,胖哥哥關心您),之所以拿 21 點當例子,是因為在這個遊戲中賭場使用固定牌數發牌,規定也很合理,所以職業賭徒通常認為 21 點是賭場中最公平的遊戲。而因為發牌的牌數固定,職業 21 點賭徒通常會透過記憶一直以來大牌出現的次數,來判定接下來剩下的牌對賭場有利還是對賭客有利 (註:這種行為俗稱「算牌」,胖哥哥並不鼓勵賭博,也不鼓勵算牌,這裡只是拿 21 點來當範例而已,實際的算牌技巧更為複雜,而世界上幾乎所有賭場都明文禁止算牌行為,千萬不要看了這一段就直衝賭場啊,胖哥哥不會負責的!)。

在這個賭局中,可以看出大數據的典型應用,賭客有定義明確的問題或目標 (我該怎麼利用現有的資源從賭場手上贏錢?) 以及大量的資料 (我手上的牌、荷官的牌、現在的牌面、過去的牌面),其中最能解決問題、達成目標的資訊便是計算大牌的出現次數,推測未發出來的牌,並經過判讀 (資料探勘),得出最適合的決策方向。

將這樣的概念應用在商業上,便是透過蒐集客戶的行為資料,經過分析判讀,轉為對公司而言有用的資訊,增加客人購買產品的機率、頻率甚至是金額。所以在大數據的應用上,資料才是最重要的資產,有些時候甚至比公司一時的獲利還要重要,如 Expedia、Agoda、 TripAdvisor 等網站作為資訊提供者,在營運的初期往往都是將重心放在蒐集客人的使用習慣與瀏覽行為,而非著重於當下的營利,這些網站在成功將資料轉換為有用資訊之後,便成功地抓住了使用者的習慣與偏好,進而成為市場中的佼佼者。

大數據不是最新風潮,而是在技術上有所突破的資料探勘

實際上,大數據的分析未必一定得依靠電腦,只要邏輯正確,用紙筆計算也可以得出可靠的結果。大數據的基本原理以及操作方式其實沒有想像中先進,早期在電腦技術還沒有現在這麼發達時,資料探勘便已經以其他方式出現了。資料探勘技術最早可以追溯自十七、十八世紀,當時就有人開始使用貝氏定理及迴歸分析來找尋資料間的相關性。

大數據不一定要花很多錢,但也無法讓電腦自己變成神探

要應用大數據其實未必要花許多錢,在硬體設備方面,大部分的公司絕對有能力自行負擔,重點是在邏輯!

要將大數據運用得好,所需要的不僅僅是硬體方面,正如前一點所說的,砸下再多錢都無法讓電腦自己變成神探福爾摩斯,就像影集 CSI 犯罪現場一樣,真正能讓電腦變成神探的,絕對不只是出色的電腦硬體或軟體,而是背後使用它來找出兇手的專業團隊。這些團隊必須要對整個產業和市場具有敏感度,具備判讀資料與消費者喜好間連結的能力,才能夠從資料當中找到真正有價值的資訊。

大數據未必需要將所有資料拿到網路上面分析

我能理解為什麼大多數的人會有這樣的誤解,畢竟大數據聽起來是個很高端的技術,又大又數據的,感覺就是很潮的科技趨勢。儘管我能理解誤解背後的理由,這個誤解卻已經倒果為因,很可能讓許多創業人士因此多走冤枉路。

要開始應用大數據做資料探勘時,首先要先找到客戶是在哪邊取得服務、客戶蒐集資訊的方式以及有哪些因素會影響客戶的決策,許多公司之所以在網路上作資料探勘,是因為現代多數客戶的商業行為都在網路上完成。如果今天創業者的通路較為單純,或是使用實體通路,那創業者所需要蒐集的資訊就會更單純,未必需要使用網路。

舉例而言,擺地攤的小販需要注意哪些資訊呢?如果是賣雨傘的小販,可能就要多多注意天氣預報,才能在大雨傾盆的時候賺到錢;而如果是賣圍巾的小販,自然就要注意最近的低溫特報,才能在寒風中享受激增的買氣,或是在情人節推出 999 純金絲編織而成的真心圍巾,就可以大賣。

關鍵數據的蒐集,未必有那麼複雜,在線上蒐集數據或許方便,但同時要分析的資料量也會多上許多,進而增加資料探勘的難度,回過頭來反而徒增創業者的困擾而已,應該要回歸到原點,開始思考客戶的消費情境,這樣也才能更準確定義所要找的資料。

大數據是方法,不是目的地

有些人覺得有了大數據,就能夠做出所有的預測,了解客人所有行為,在哆啦A夢出現以前,這種事情不可能發生。這讓我想起早年有人請著名的法師當公司的董事長,讓他為公司批流年看風水,當公司遇到問題時,便請法師出面開壇作法,期望公司能否極泰來。所以公司賺錢是天意,不賺錢也是天意。

大數據不是神,也不是先知,無法為公司做出任何預測,公司必須要先有決策的方向,才能從資料探勘中找到能輔助決策的資訊。如果要做比喻,大數據不是能帶領公司找到寶藏的藏寶圖,反而更像是指南針,協助公司找到更準確的方位。舉例而言,大數據無法幫公司找到目標客群,但若公司已經有明確的目標客群,便能從購買者的性別、購買時間、購買偏好等資料找出對公司決策有幫助的資訊。

大數據提供資訊讓創業者做出「較正確」決策,而不是「最好的」決策

就像打出全壘打牆的棒球,出去了就是出去了,不會再回到球場上了。任何收集到的資訊也都是過去的,未來所面對的變因跟過去不會一樣,例如油價上漲、新的競爭對手、或是新的手機功能,都有可能改變市場原有的相貌。

如同先前指南針的比喻,創業者往往必須在使用大數據做決策的過程中不斷作修改,才能逐漸走上正確的方向。這是因為所蒐集的數據都是過去的資訊,未來情勢的發展仍有一定的變數,所以透過統計及分析這些資訊,創業者只能做出最為可行的推測,而無法做出最百分之百正確的決策。這就像是投資股票一樣,股票市場有著過去幾十年的交易資料,但除了內線交易之外,沒有人能夠確定隔天股價的走勢,因為其中牽涉到太多無法決定的因素。

大數據本身無法獲利

除非創業者本身所做的是大數據的顧問工作,否則大數據本身是無法營利的。創業者還是得要繼續為客戶創造價值、為客戶解決問題,大數據僅能為公司找出最適合的決策方向,讓決策者事半功倍,而不能實際解決客戶的問題。就像是在玩 21 點時,真正獲利的還是下注的行為,而不是所蒐集到的資料本身。

如何使用大數據

我很喜歡的一本書《銀河便車指南》(又譯作星際大奇航, The Hitchhiker’s Guide of Galaxy )中有個很有趣的寓言,有個超智慧生命種族建造出一台超級電腦,生命、宇宙以及所有事物的終極答案,超級電腦在期望找到經過七百五十萬年的演算後,得出了「42」這個答案。

「但是這可是個大哉問!是生命、宇宙以及所有事物的終極大哉問!」超智慧生命種族不是非常滿意這個解答。

「是啊。」超級電腦回答,「但這個大哉問究竟是什麼呢?」

超智慧生命種族也說不出個所以然。

「那就對了。」超級電腦繼續又說,「等到你們知道問題是什麼的時候,你們自然就知道答案的意義了。」

先前在 21 點的舉例中有稍微提到,要正確應用大數據,必須要有明確的目標、清楚的流程,以及定義完整的問題,轉換到商業應用上,便是明確找出目標客群、有清晰的販售流程,同時定義清楚要找出哪些會影響客戶決策的因素。在資料探勘的過程中,使用者必須有目的且有邏輯地蒐集資料,也必須清楚明白蒐集這些資料的原因,才能夠從雜亂的資料淘出對公司而言有價值的資訊黃金,否則再多的資料,也只會像是沒有價值的泥沙一樣,只會造成公司的負擔。

大數據使用實例

全世界最大的租車公司赫茲租車(Hertz),便體認到要在行動時代中脫穎而出,單單只是靠過去的租車模式是行不通的。身為在全世界 146 個國家、有超過八千個據點的汽車租賃商,赫茲租車每天所收到的顧客資訊無法計量,這其中還包括數以萬計來自網路問卷、電子郵件及簡訊等來源的客戶回應,但透過正確應用大數據,資訊將集中處理,並統一資料權值,他們不但減少了處理客戶回應的時間,還成功地從原本難以招架的資料量中,擷取出先前無法取得的有用資訊。

例如他們從資料探勘中發現,在費城的某些時段中,還車的時間會延遲不少,他們便能從此資訊中調整員工人力的分配,減少客戶因等待產生的不滿;又或者他們從資料中發現在聖誕節時,許多人會從紐約搭飛機返鄉,相對而言紐約的租車需求減少許多 (畢竟在紐約市區開車,是一件很考驗意志力的事情),他們便能依照過去的資料分布,更準確地將車子從紐約分配到各處,提升客戶的使用率。要是沒有資料佐證,誰敢把車從人口密集的紐約大城市移到人口少的鄉鎮呢?

除此之外,透過大數據,赫茲租車能更準確貼近顧客的需求,他們會在消費收據上鼓勵尚未加入黃金會員的客戶升級,或者提醒客戶他們的信用卡或駕照即將過期,而他們更能每天透過電話中心、簡訊、櫃台或行動裝置,為客戶提供高達五萬六千多種不同的個人化優惠,從而大幅提高客戶的滿意度。

相似的應用也已在旅遊相關產業中實行多年,航空公司就是一個最好的例子。機票超賣這件事情雖然是導遊、領隊及旅客的夢魘,但是以航空公司的角度而言,卻也是必要之惡。因為班機是一種消耗性的商品,這此飛機飛出去,機為沒有坐滿,空著的機會就是虧損。那麼航空公司要怎麼準確判斷出合理的超賣範圍呢?透過大數據分析,航空公司可以明確判別出各目的地的淡旺季、乘客的艙等、性別及年齡分布、乘客之前有沒有過退票的先例以及乘客先前去過的目的地等資訊。從這些資訊中,航空公司可以精算出合理的超賣範圍,從而最大化自己的獲利。舉例來說,如果航空公司發現一架乘載 100人的航線在精算過後發現乘客退訂的機率有 10%,那航空公司便能合理估算出若要將航班塞滿,起碼需要超額賣票到 111 個人次。

大數據還能怎麼運用?從共乘平台看到大眾運輸的需求

台灣已經有許多創業團隊如 Tripda、Carpo 等共乘平台,他們可以透過整合使用資料,找出通勤時間有哪些路線特別多人選擇共乘,進一步找出在哪些地點有多少人要去一樣的目的地。

若將這些地點及目的地串連在一起,政府在規劃大眾運輸時,便能從這些資訊中獲益,規劃出更貼近市場需求的通勤公車,讓通勤時間的人潮能充分利用到大眾運輸工具,政府在其他時間將車輛轉調至其他有需求的地方,將大眾運輸工具的使用率提升到最高。

讓訂位網站打破黃金店面的迷思

EzTable 或 Yelp 這種餐廳訂位網站,能蒐集客戶訂位時的時間及所在位置,以及所訂餐廳的位置及訂位時間,推估出客戶願意移動的距離及等待時間,從這些資料中,就能打破「黃金店面」的迷思。

舉例來說,如果今天許多在信義區的消費者,都訂了位於東區的著名餐廳,那相同的移動距離及時間,店家如果把店面開到象山去,便能減少許多店租,而減少了的店租,便可以回饋到消費者身上,或者是提高店家的獲利;也因為開了分店,消費者在各個店家苦苦排隊的情形也會有所改善,未來在東區等待的時間,可以到象山看夜景。

最重要的是,在大數據及行動裝置的時代,未來店家也許再也不需要受限於地理位置上「黃金店面」的迷思,能夠更專注於自己的食物及服務上,無論對消費者還是店家都是雙贏的選擇。

Photo credit by Whatknot

發表迴響

在下方填入你的資料或按右方圖示以社群網站登入:

WordPress.com Logo

您的留言將使用 WordPress.com 帳號。 登出 / 變更 )

Twitter picture

您的留言將使用 Twitter 帳號。 登出 / 變更 )

Facebook照片

您的留言將使用 Facebook 帳號。 登出 / 變更 )

Google+ photo

您的留言將使用 Google+ 帳號。 登出 / 變更 )

連結到 %s