2008年,英國政府決定,13歲以下的女孩要接種人類乳突病毒(HPV)疫苗,以防治子宮頸癌。這項全國計畫受到民眾讚賞,認為每年可拯救數百位女性的生命。然而,計畫推行後不久,媒體似乎有極具說服力的證據,證明這種看法太過樂觀。
媒體報導,14歲女孩娜塔莉.摩頓在接種疫苗後數小時死亡。衛生當局的反應是檢查疫苗庫存,回收可能有問題的疫苗。然而,有人覺得這樣做還不夠,要求中止大規模的接種疫苗計畫。
害死人的疫苗?
有些人會堅持引用所謂的「預防性原則」,簡單說就是「小心駛得萬年船」。然而,這裡的風險在於,解決了一個問題,卻製造出另一個問題:計畫喊停雖然能消除接種者死亡的全部風險,子宮頸癌的問題卻仍然沒有解決。
此外還有一種風險,是一個值得認識的陷阱。邏輯學家把這個陷阱稱為「後此謬誤」(Post hoc,ergo propter hoc),即「因為發生在後,就以為有因果關係」。以娜塔莉的死亡為例,陷阱就在於有人可能會因為她在接種疫苗後死亡,就認為接種疫苗必然是死因。
事情必然是先有因,後有果;然而把這個邏輯反轉過來,卻有其危險:車禍事件的受害者,出發前通通有繫安全帶,但這可不表示繫安全帶會導致車禍。
比例是多少?
不過,我們姑且設想最糟的狀況:娜塔莉的死亡,真的是對疫苗的不良反應所造成。根據無法無天第一定律,理解這類事件的最佳方式是著眼於相關比例,而不是個別案例。這個事件的相關比例是多少?
娜塔莉死亡時,已有130萬名女孩接種了同樣的疫苗,這表示死亡事件的相對頻率,大約是100萬分之1。這個比例說服了英國政府,儘管面對反接種人士的抗議,還是在把可能有問題的疫苗回收後,繼續推動這項計畫。若娜塔莉果真是對疫苗產生罕見反應而喪命,政府採取的回應行動也屬合理。
病因是腫瘤
娜塔莉的驗屍結果顯示,她的胸部有惡性腫瘤,死亡與接種疫苗無關。因此,娜塔莉的死亡不是罕見的疫苗反應,是媒體落入了後此謬誤的陷阱。即使如此,當局回收可能有問題的疫苗,而不是撤銷整個計畫,是正確的做法。當然,這不一定就是真相。
娜塔莉可能是原發病例,是疫苗測試時未曾出現過的反應。深入研究這個案例的成因,尋找是否可能會出現更多案例的證據,顯然是正確的做法。
應注意相對頻率
我們不應過度受個別案例影響,而是應該注意相對頻率,並在正確的脈絡下看待這類案例。只因為發生少數一次性事件,就決心做些「改善」的經理人、行政主管與政治人物,可以從這個案例學到更多課題。他們若忽略了這點,等於甘冒因極罕見事件而採取行動的風險。
更糟的是,他們可能會根據罕見案例的「改進」,對同樣很少的資料組進行測試,又把注意力放在原始次數而非相對頻率,從而得出錯得離譜的結論。從頻繁發生的客訴到員工建議全盤改變工作方法,全都可能起因於少數不見得重要的傳聞。
受到神秘詛咒的公司
1980年代,位於英國的國防包商馬可尼通用電氣,因為一連二十多起技術人員自殺、死亡與失蹤案件,成為媒體報導焦點。開始有人提出陰謀論,而有些受害人參與機密計畫的事實,更使得這種論調甚囂塵上。
雖然這些傳聞很引人入勝,不過我們應該無視於小道消息,把注意力放在相對頻率上。在這個案例中,就是比較馬可尼發生特殊事件,以及預期一般大眾發生特殊事件的相對頻率。
一經比較就會發現,馬可尼是一家員工超過三萬人的大型公司,而那些死亡案例是在8年內陸續發生的;這表示以馬可尼的規模,那些「神秘」的死亡和失蹤案,也許並不值得大驚小怪。最起碼警方的後續調查結論就如此,不過陰謀論一直到今日還未平息。
法國也出事
平心而論,媒體近來已經開始注意比較相對頻率的重要性。2010年,法國電信公司登上頭版,因為它在2008年到2009年間,發生了30起自殺案件,次數媲美馬可尼。
2014年,這家當時已改名為橘子電信的公司,短短數個月內又出現10起自殺案,舊帳也因此再被翻出來。這一回的解釋是工作壓力,不過與報導馬可尼案件時截然不同的是,有些記者提到了第一定律的關鍵問題:以一家員工約100,000人的大型公司,這些自殺案件的發生頻率,是否真有異常?
然而這就引出一個棘手問題:該用什麼樣的相對頻率比較才適當?以橘子電信來說,是用全國自殺率(法國的自殺率是出名地高,比歐盟平均值高出40%)?還是用某個特定數字,如某個年齡層的自殺率(在法國,自殺是25歲到34歲的主要死因)?或是採用某個社經族群的自殺率?
從相對頻率著手
橘子電信案件尚未裁決;有人說這可能是統計上的異常,有人則堅稱工作壓力是自殺的真凶。真相很有可能永遠無法大白。
無論真相如何,要解讀這類問題,應該要從相對頻率著手。舉凡政府公共衛生運動、跨國企業聘僱員工等任何事,只要牽扯的人夠多,就有成為頭條新聞的潛能,儘管佐證的事件看似有說服力,究其實卻沒有太大意義。
百慕達奇案解秘
解讀詭異言論和陰謀論時,相對頻率特別管用。就以惡名昭彰的百慕達三角為例。百慕達三角位於西大西洋,船隻和飛機經常在那裡失蹤。自1950年代以來,有無數報告指出,船隻飛機一旦進入由邁阿密、波多黎各和百慕達島所構成的三角形區域,就厄運難逃。世人提出許多理論解釋這些事件,從幽浮攻擊到瘋狗浪都有。
現在,不要著眼於「離奇」失蹤的原始次數,而是要和大西洋其他區域發生失蹤案件的相對頻率比較。如此一來,你就會驚奇地發現:所有那些原因不明的失蹤案件,完全有可能發生。
每年有數萬艘船隻飛機,穿越這塊廣達100萬平方公里的領空和海域,即使把所有無法解釋的怪事都算進來,百慕達三角甚至擠不進全世界十大危險海洋區。世界知名保險集團勞合社精明的保險精算師,當然不會因為百慕達「離奇」傳聞的原始次數而不安。他們並沒有因為船隻或飛機勇闖百慕達而加收保險費用。
神秘鐵達尼預言
關於1912年4月的鐵達尼號(Titanic)事件,有人說早在船難發生的14年前,已經有一本書精準預言種種細節:美國作家摩根.羅伯森1898年出版的短篇故事〈徒勞無功〉,敘述一個名叫約翰.羅蘭德的甲板水手故事;他在史上最大艘船隻上工作,4月某個夜晚,船在於北大西洋撞上冰山沉沒,造成重大死傷。猜猜看這艘船叫什麼名字?「泰坦號」(Titan)。
兩件事的雷同之處不只於此。在羅伯森筆下,這艘船全長240公尺,跟鐵達尼號差不多;它被譽為「不沉之船」;而船上搭載的救生艇,不到船上人員所需的一半;它甚至跟鐵達尼號一樣,都是右舷撞上冰山。
這一連串的巧合當然令人驚嘆,讓人不禁懷疑羅伯森寫作本書時,是否感應到什麼預兆。也許他真的有所感應,但還不如說故事劇情正好展現非獨立事件會造成何等的巧合。〈徒勞無功〉發表時,國際間已經展開打造巨無霸客輪的比賽,競逐頒給最快速大西洋客輪的藍絲帶獎。
事出早有因
十九世紀最後十年,最大型的船隻已從全長大約170公尺,增加到遠超過200公尺,因此240公尺顯然並非不可能。至於這種龐然大物會發生什麼大災難,當時已有人發覺冰山會是一大威脅。至於救生艇數量不足的問題,當時也有人提出警告,相關規範未能跟上船隻規模迅速增長的速度。
此外,撞上冰山的是左舷還是右舷,猜對的機率顯然是一半。至於羅伯森為筆下厄運纏身之船所選的名字,也沒什麼好訝異:如果要為一艘巨無霸船隻取個響亮的名號,「泰坦號」顯然會比「侏儒號」之類的名字更容易出線。
簡而言之,羅伯森想寫一個巨船的船難悲劇故事,故事要寫得逼真,多少會納入與鐵達尼號相近的事件跟特徵。因此他的寫作在選材上,根本就不是隨機的獨立事件。
一場世紀金融災難
美國投資銀行高盛歷經150多年的歷史,什麼大風大浪都見過。經濟繁榮、金融崩潰、股票泡沫、全球衰退……無論碰上什麼危機,高盛總是能夠安然度過。
但是在2007年8月,它卻一頭撞上堪稱金融界冰山群的危機,不得不對兩檔基金注資超過20億美元,免得它們沉入海底。高盛財務長大衛.維尼亞當天告訴記者的話,已是金融行家圈的名言:「我們已經連續好幾天,看到25個標準差的波動。」
就算是最資深的量化分析師,也無法理解維尼亞口中所說的25個標準差事件。這類事件實在太過奇特,就連標準公式也無法處理,必須經過特殊處理,才能在報表上把極低的機率打出來。
不可能碰到的事件
當數據處理好,答案卻令人訝異:根據他們聲稱,他們碰上的是平均每隔10的135次方年才會碰上一次的事件。這甚至已經超越天文數字了,因為這令人無法想像的時間尺度,甚至比宇宙生成還要久。而且,據維尼亞所言,高盛還不只碰到一次,是碰到好幾次。
沒錯,極罕見的事件有可能、也確實會發生,但是一連幾件同時報到,你不禁猜想,算出這些機率的方法,是不是哪裡出了問題?要計算這些機率,需要用到該事件所謂的或然率分配(probability distribution);或然率分配有各種形狀跟大小,不過在金融界裡,每個人幾乎都不加思索,直接採用「鐘形曲線」。為什麼不?畢竟鐘形曲線不就是「常態分配」嗎?
維尼亞發表這段聲明的將近一個世紀前,假設事情「遵循常態」的概念開始流行時,就已經有人對此表示擔憂。1901年,英國統計學家卡爾.皮爾森率先檢驗聲稱無所不在的鐘形曲線,發現證據並不是很有說服力。他寫道:「我只能說,常態曲線……是極反常的現象。」
不符合常態分配
維尼亞的聲明為全球金融危機與衰退揭開序幕,衝擊在多年後仍然有感。這也引發了對於常態分配假設的激烈辯論,但這種辯論不是頭一遭。早在數十年前,就有明確的證據顯示,金融市場的表現並不符合常態分配。
備受景仰的英國財金數學家保羅.威摩特,在2000年就試著警告他的量化分析同儕,危險何在:「很明顯地,世界若要免於遭受肇因於數學家的市場崩解,我們亟需重新思考……模型背後的假設,如常態分配的重要性、消除風險、可量測的相關性,這些可能都是不正確的。」
言者諄諄,聽著藐藐。金融機構甚至賭更大,拿數學模型為他們的曝險部位背書。素來以「條款與細則」約束客戶的金融機構,似乎既不知道、也不在乎鐘形曲線的使用條款與細則。
美國國庫券市場在2014年10月,經歷了單日7.5個標準差的波動後,摩根大通執行長傑米.迪蒙告訴股東,這種事件理應幾十億年才會發生一次,但他緊接著就補上一句但書:美國國庫券市場也不過才200年左右的歷史,「這點應該會讓你們開始質疑,統計原理是不是有問題。」
機率思考:大數據時代,不犯錯的決斷武器
作者: 羅伯‧麥修斯
譯者: 高英哲
出版社:大牌出版
出版日期:2017/02/22