2017年8月28日 星期一

大數據只能猜測不能預測



大數據分析在現在的行銷環境下無所不在,不論是google搜尋分析、Facebook的廣告目標設定、你企業內的會員、網站的GA分析等等,都是日常營運所必備的,但是多數的行銷人員都把這些分析結果當成事實,繼而以這些結果做後續行銷策略的擬定與規劃、執行。

這些結果其實是最佳猜測

為什麼這麼說呢?

你應該清楚,人所展現出來的行為是理性與感性的綜合表現,並不是純粹理性,也不是純粹感性,人的決策行為是混合判斷的湧現行為,現今大數據或AI所產出的一切很明顯是純理性分析的結果,也就是在我們所謂的經濟人的理型世界中合理的行為預測,在"假設特定情境、時間、經濟人的行為極有可能符合模型預測。

其關鍵就在假設這兩個字上,由於影響市場的變數幾近無限多,因此我們必須有假設前提XXX情況下,而這個假設是否正確,就需要不斷的做小規模的PDCA循環驗證。

因為技術的進步、數據的累積、驗證後修改的經驗,使得大數據所用的分析模型是越來越複雜,而我們知道越複雜的東西不可避免地將會越脆弱,這真是一個非常弔詭的狀況,最終它將複雜到無人能理解,人們因無法理解而放棄理解轉向全然相信,此時若系統出錯就會造成全面性的崩潰,例如歷次的金融風暴,而出錯的原因,並不是模型出錯,而是有特定變數不在模型的計算內,這就是真實世界與模型世界的不同。

最有名的說法就是火雞錯覺,一隻被飼養的火雞,每天按時進食、運動,日日如是。根據統計學,牠每按照這樣的規律多生存一天,其重複這樣生活的可能性就愈大。若根據統計學,牠將毫無疑問地重複這樣的生活直到永遠。這隻快樂的火雞一直抱著這樣的想法活了999天,牠卻在第1,000天、感恩節前夕,被殺了!

大數據不太可能預測到火雞會有被殺的一天。

大數據預測模型的前提是
1.      數據量夠多
2.      時間夠長
3.      選項夠少
4.      計算的是已知風險(未知的風險例如火雞錯覺是不可能計算的,因為它是未知)

曾經有一個大型銀行集團,想試著計算25支股票的未來一年走勢,後來他們發現要能精確計算,他們必須先累積500年的歷史交易資料,才有機會使得模型具有實用性,問題是有股票交易只有百年歷史,更何況西元25世紀時,恐怕這25家企業連一家都不存在了。

所以要應用大數據分析,不是直接取用其結果,而是根據其結果再透過個人的直覺、感性判斷,因為個人的直覺判斷是用於未知、資料不足、選項很多的狀態之下,是天擇給人類適應現實世界的禮物,若沒有直覺判斷,人類這個物種老早以前就滅絕了。

舉例而言,情緒、憤怒、悲傷、快樂、好奇等等對於生存若是沒有幫助,在物競天擇的定律之下,老早就應該從我們的DNA中消失,之所以我們仍保留這些情緒、感性、直覺就是因為他們是生存的必要條件之一。

想要正確應用現代科技、大數據、AI?
別忘了你的直覺判斷才是最後的把關者,我們與網路數位科技是互補的,這樣才能將你的企業、行銷策略最佳化,最佳化成功的機會。

林文傑

沒有留言:

張貼留言

注意:只有此網誌的成員可以留言。