林文傑: 大數據只能猜測不能預測

2017年8月28日星期一

大數據只能猜測不能預測

大數據分析在現在的行銷環境下無所不在，不論是google搜尋分析、Facebook的廣告目標設定、你企業內的會員、網站的GA分析等等，都是日常營運所必備的，但是多數的行銷人員都把這些分析結果當成”事實”，繼而以這些結果做後續行銷策略的擬定與規劃、執行。

這些結果其實是”最佳猜測”。

為什麼這麼說呢?

你應該清楚，人所展現出來的行為是理性與感性的綜合表現，並不是純粹理性，也不是純粹感性，人的決策行為是混合判斷的湧現行為，現今大數據或AI所產出的一切很明顯是純理性分析的結果，也就是在我們所謂的”經濟人”的理型世界中合理的行為預測，在"假設”特定情境、時間、經濟人的行為極有可能符合模型預測。

其關鍵就在”假設”這兩個字上，由於影響市場的變數幾近無限多，因此我們必須有假設前提”在XXX情況下”，而這個假設是否正確，就需要不斷的做小規模的PDCA循環驗證。

因為技術的進步、數據的累積、驗證後修改的經驗，使得大數據所用的分析模型是越來越複雜，而我們知道越複雜的東西不可避免地將會越脆弱，這真是一個非常弔詭的狀況，最終它將複雜到無人能理解，人們因無法理解而放棄理解轉向全然相信，此時若系統出錯就會造成全面性的崩潰，例如歷次的金融風暴，而出錯的原因，並不是模型出錯，而是有特定變數不在模型的計算內，這就是真實世界與模型世界的不同。

最有名的說法就是火雞錯覺，一隻被飼養的火雞，每天按時進食、運動，日日如是。根據統計學，牠每按照這樣的規律多生存一天，其重複這樣生活的可能性就愈大。若根據統計學，牠將毫無疑問地重複這樣的生活直到永遠。這隻快樂的火雞一直抱著這樣的想法活了999天，牠卻在第1,000天、感恩節前夕，被殺了！

大數據不太可能預測到火雞會有被殺的一天。

大數據預測模型的前提是…

1. 數據量夠多

2. 時間夠長

3. 選項夠少

4. 計算的是已知風險(未知的風險例如”火雞錯覺”是不可能計算的，因為它是未知)

曾經有一個大型銀行集團，想試著計算25支股票的未來一年走勢，後來他們發現要能精確計算，他們必須先累積500年的歷史交易資料，才有機會使得模型具有實用性，問題是有股票交易只有百年歷史，更何況西元25世紀時，恐怕這25家企業連一家都不存在了。

所以要應用大數據分析，不是直接取用其結果，而是根據其結果再透過個人的直覺、感性判斷，因為個人的直覺判斷是用於未知、資料不足、選項很多的狀態之下，是天擇給人類適應現實世界的禮物，若沒有直覺判斷，人類這個物種老早以前就滅絕了。

舉例而言，情緒、憤怒、悲傷、快樂、好奇等等對於生存若是沒有幫助，在物競天擇的定律之下，老早就應該從我們的DNA中消失，之所以我們仍保留這些情緒、感性、直覺就是因為他們是生存的必要條件之一。

想要正確應用現代科技、大數據、AI嗎?

別忘了你的直覺判斷才是最後的把關者，我們與網路數位科技是互補的，這樣才能將你的企業、行銷策略最佳化，最佳化成功的機會。

林文傑

請訂閱我 https://pressplay.cc/onsaleking

部落格http://onsaleking.blogspot.tw/

沒有留言:

張貼留言

注意：只有此網誌的成員可以留言。

訂閱：張貼留言 (Atom)

2017年8月28日 星期一

大數據只能猜測不能預測

沒有留言:

張貼留言

2017年8月28日星期一