讀書札記151208 Fooled by Randomness (上)

讀書札記151208

Fooled by Randomness (上)

執筆人:蟬

 

《Fooled by Randomness》(2005) Nassim Nicholas Taleb

 

〈關於隨機〉

「隨機Randomness也許能在學術上精確定義,但在日常生活上粗疏理解,一般是指「缺乏模式及可預測性的事件」。***

例如彩票、擲毫的結果都是大眾普遍知道的隨機事件。

 

為了系統性地表述隨機事件的結果,數學家提出了「機率Probability」的概念。機率是以數學方法表達一項事態發展的可能性。*** 例如一顆完美的骰子擲到任何點數的機率均是1/6。

 

在大量採樣的情況下, 使用機率對其 結果分佈 作出預測相當有效;但對於個別和小量採樣則不然。*** 而且機率必須透過弄清事件的結構而獲得:例如在封閉和具備清楚規則的遊戲中,屬於「演釋法deduction」的產物。****

 

另一個分析隨機的方法便是透過對過往不同結果出現的「頻率frequency」進行統計,按其分佈推測事件的未來結果。**** 這種以統計作基礎的方法屬於「歸納法induction,在處理無法弄清因果causation的事件尤其有效。

 

雖然機率和頻率統計以不同角度去描述隨機的面貌,但有趣的是 “隨機看起來往往並不隨機”。 英國著名數學家Karl Pearson在1902年記錄了一系列過百萬次輪盤遊戲的結果,發現在極高 “統計顯著性”下,該系列結果表現得極不隨機。雖然可以將其歸因於實驗裝置的不完美,但隨機可能便是這樣的一個概念:

「理型的隨機並不存在,而真實的它往往看起來並不那樣隨機。」*****

 

電腦保安方面經常會應用到隨機,將文本內容「加密」的方法一般大量運用隨機字串String。

在講述數學家Alan Turing的電影《The Imitation Game》中,Turing發明的解密機將當時被認為幾乎不可能破解的Enigma加密機擊敗。 (過程當中涉及德軍沒有完全按照使用手冊進行作業。J)

即使經過數十年來電腦的飛躍發展,現時世上也只有極少數電腦能夠生產真正的隨機結果。軍用的 “隨機產生器”必須倚賴粒子運動、氣象等資訊作為種子,才能產出“相對隨機”的內容。

 

〈強說道理的人〉

人們在處理日常資訊的時候,為了更有效率地大量儲存,往往需要將資訊加工:包括為散亂的事件建立關係,並提取重點。 人腦從記憶中提取資料時,碎化的重點往往需要重新串連,構成故事去加以理解。 這個記憶系統先天上有其限制,更且帶有偏見。

 

人在面對雜亂的訊息時會本能地從中尋找「模式Pattern」,因為模式能省卻處理和記憶所需的能力和容量,而各種模式當中最常用的便是「因果關係causation」。因果關係令所有已經發生的事情看似有根有據:只要滿足初始條件,便能得到特定結果。***

在日常生活中因果關係固然觸目皆是,但貌似而實非者卻也為數不少。 將一切事理都看作因果關係, 最大的壞處便是失去全面判決的能力

 

例子:某富翁忽發奇想,懸賞招募玩家參加「俄羅斯輪盤」遊戲:玩家只需向腦袋開槍一發,如為空發,便能獲得一千萬元獎金;每位玩家每年限玩一次。

富翁的龐大財富讓這遊戲持續多年,而玩家Sim在過去15年一直成功贏得獎金,並被新生代捧為人生大贏家,眾口交譽其膽識過人。

 

從結果看,玩家Sim真的相當成功。但如果以機率去思考他是如何走過來的,便知道他冒了多大的險。按每年勝出的機率5/6計算,Sim能連續勝出15年的機率為6.5%,即每1000個玩家當中只出現65個Sim類人物。***

 

在評價玩家Sim的成功時,不妨以另一角度切入:Sim在過去15年遊戲生涯的平行時空中,另外產生了64個勝出的Sim,和935個因輸掉而死去的Sim。

換句話說,65個生存Sim的總代價是在平行時空中遺下的935個死去的Sim。平均來說, 每個生存Sim應付代價是14.385個死Sim。

 

結論:當事件並非完全「決定性deterministic」—即同樣初始條件必然產生特定結果—的時候,一個決策的代價應為所有其他可能結果(史家稱為「替代歷史alternative history」)的總和。*****

 

這種將不確定性和概率內化的分析方法,無疑將事物的相關度弱化,令本已複雜的事物更難處理。*** 但在互聯網科技一日千里的今日,最流行的數據處理方法:「大數據Big Data」,不正正就是向因果關係不確定的一種妥協了麼?

 

然而人的思考系統對於不確定性和概率是相當不適應的,早在60年代心理學家便透過不同的實驗觀察到這點。近年美國著名心理學家Daniel Kahneman更提出「兩套系統Two System」去描述人類思考系統的特徵和盲點,並以此獲得諾貝爾經濟學獎。

下篇將介紹一些常見且甚具影響力的認知系統偏見,和隨機與非線性相遇的問題。