2015年5月26日星期二

有紋身就是壞人?

有紋身就是壞人?


如果有一天,你與孩子走在街上,看到一個身上紋滿圖案的人。請問讀者會有什麼想法?

母親通常都會勸告孩子,在街上不要惹起紋身漢的注意,因為他們通常不是好人。我們可以把母親的說話煶煉成為這一句:

遇到身上有紋身的人,便有很大機會遇到壞人!

但其實只要仔細地想一想,我們就會發覺這一種想法很有問題。因為,既然我們不知道究竟有多少個不是壞人但卻有紋身的人存在,我們又如何可能肯定「有紋身的人,就是壞人」這一句想法呢?

試想像,在有一個人口剛好是十萬零一百人的城市。當中有100個壞人,其餘10萬個都是好人。在這100個壞人當中,90%是有都是有紋身的人。於是我們便可以得知如果他是壞人,則他便有90%機會有紋身」(圖一)



如果某人是壞人,那他便有90%的機會是有紋身的人
圖一
但以上絕不等於說:


「如果他有紋身,則他便有90%機會是壞人」


情況就有如「我老竇有鬚」不等於「有鬚就是我老竇」啊!而且,我們還要考慮城市其餘十萬位好人呢!假設在這十萬位好人當,有1%是有紋身的人。那麼,就算只有1%,人數也會高達1000位呢!(圖二)



圖二


換言之,在這個城市之中,假如有一天你逛街時碰見一個紋身漢。究竟他有幾可能是壞人呢?我們當然要把所有「有紋身的壞人(90個)」和「有紋身的好人(1000位)」一併考慮,然後再計算,在這1090個有紋身的人當中,你有多少機會遇到那90個壞人。以數學表達,即是:



即是說,雖然在有90%壞人有紋身,但當你在街上遇到紋身漢時,只有8.25%的機會他是一個壞人呢!相反,他是一位有紋身的好人的機會高達91.75%呢!

如何粗略地避免錯誤


讀者可能已經上了一課歷史上最簡短的貝葉氏(Bayesian)統計學課。倘若讀學懂了以貝葉氏的眼光來思考所遇到的現象,我們便可以擺脫很多以偏概全的謬誤。

最常見的一種以偏概全,就是只以個人經驗做推論,而忽略了一些超越個人經驗範圍的可能性。如果要避免犯上故事中媽媽的謬誤。筆者建議讀者可以嘗試進行以下的訓練,減低犯錯的可能性。這個方法可以幫助我們在無需要應用到大量數字的思考下,利用簡單的日常語言思考貝葉氏統計原理,作出快速的檢定。得出一個粗略答案。筆者稱這個方法為:「留意後項的相反」。


第一道防線(相對數量)

當每一次聽到帶有判斷性的條件句,例如:「穿套裝的人,就是專業人士。」於這個時候,我們適宜把以上條件句的後項「專業人士」抽出來,然後想一想後項詞語的相反,即「不專業人士」究竟有又多少?

如果讀者發現,數量上「不專業人士」比「專業人士」多。那麼,我們便有初步理據懷疑「穿套裝的,就是專業人士」這一個想法是錯的。

專    業(相對數量較少):#####(5個)
不專業(相對數量較多):###############(15個)

相反,如果讀發現,數量上「不專業人士」比「專業人士」少。那麼便可以提高「穿套裝的,就是專業人士」的信心。

專    業(相對數量較多):###############(15個)
不專業(相對數量較少):#####(5個)


第二道防線(所佔比重)

就算過了第一道防線,亦不等於「穿套裝的人,就是專業人士」就是可信的。我們還需要再作進一步的分析,瞭解「專業人士」當中,穿西裝的人究竟佔專業人士之中的多少,亦要瞭解在「不專業人士」當中又佔多少。

專    業:###############(佔15分之10)
不專業:#####(佔5分之2)

專    業:###############(佔15分之5)
不專業:#####(佔5分之2)

如果我們不能肯定數量上專業人士比不專業人士多,又不能肯定穿西裝的人於專業人士之中有較大比重,則我們便不能輕信「穿套裝的人,就是專業人士」這一想法了。

說穿了,其實機率都是分子與分母之間的比例關係。在分子不變的情況下,任何令分母增大(或減少)的事項,都會減低(或增加)機率。反之,在分母不變的情況下,任何令分子增大(或減少)的事項,都會增加(或減少)機率。