擅長演算紙上的數學習題,不等於具備數學素養!
面對現代資訊金融社會各式各樣的數字轟炸,能夠運用數學思維和資訊統計工具,以簡馭繁,排除雜訊、擺脫偏見,從數據中獲得洞見,這才是各行各業的社會菁英、以及未來的社會菁英,都應當具備的數學素養。
英國資訊理論暨統計科學專家奧利弗.強森,不使用任何複雜公式和希臘字母,他從數學結構、隨機性、資訊理論這三大單元切入,告訴大家:一張好圖勝過千言萬語、如何在合理範圍內估算、對數刻度下的指數成長有何妙用、絕對要學會的統計方法、非常實用的隨機漫步理論、排隊理論和網路理論等等,可大幅提升我們理解和應對現實世界的能力。
數學已經「酷」起來了
多年來,每當我告訴別人我是數學家時,都能預見對方會出現的反應。他們通常會變得十分緊張,慢慢和我拉開距離,然後躲到房間的另一端。人們通常會理直氣壯承認:「我在學校時,數學一直都學不好。」語氣中還能感覺到他們以此為傲。
但最近這種狀況開始轉變了。圖靈(Alan Turing)成為最新50英鎊紙鈔上的人物;奧斯卡獎提名了《魔球》、《關鍵少數》和《心靈捕手》等電影;「突破獎」頒獎典禮上,可以看到好萊塢明星在電視直播中,頒發數百萬美元獎金給數學家。我敢自信滿滿的告訴大家,數學已經「酷」起來了。
數學愈來愈受大家重視的另一個重要原因,則是新冠肺炎疫情。突然間,數字變得無所不在。最近就連卡戴珊的Instagram貼文這類社群媒體,都能看到視覺化資料。人們開始廣泛使用「指數」和「信賴區間」等詞彙。以上種種,讓我覺得,瞭解數字能發現趨勢、並且做出預測,並不是什麼可恥的事。
疫情期間,我使用@BristOliver的推特帳號,以數學家的角度,發表對新冠肺炎統計數據的解讀,盡可能幫助人們瞭解現在的狀況,並且讓氾濫的數字變得更容易理解。在這個過程中,我不斷感受到,原來我在英格蘭布里斯托大學傳授給大學生的數學技巧,無論對任何人來說,都價值連城。
我們的生活已經逐漸受到資料和演算法支配。Siri完全可以聽懂我們說的話;使用「Google翻譯」也能得到接近專業水準的譯文;Netflix能夠將我們的觀看紀錄,與類似的使用者資料比對,藉此推薦我們最可能喜愛的同類型影劇。
瞭解數字背後的事實
縱使如此,人們可能不清楚這類人工智慧和機器學習,實際上都是建立在數學和統計學的基礎上。人工智慧和機器學習在二十一世紀有了全新面貌,不斷提升的算力也提供了極大動能,但背後的基礎始終離不開數學。這樣的矽谷奇蹟依仗的是:在百萬維度世界中的「點雲」(空間中的一組離散的數據點)幾何形狀、在隨機中找出結構和模式的技術,以及處理大量數據的嚴謹數學方法等等概念。
大部分人都不清楚專業數學家整天在忙什麼,也許他們會認為我們在計算複雜的微積分,或者互相較勁誰能記住最多圓周率的位數;也許他們腦海中會浮現出一個不起眼的老頭,拿著粉筆在黑板上書寫充斥著希臘字母而難以理解的公式(老實說,這個猜測算是十分接近)。人們會這樣看待數學家,我們也要負起部分責任。數學家並沒有盡心盡力向大家解釋,為什麼我們所做的事如此重要。
這本書試圖翻轉這些偏見。現代世界人人皆有手機、平板或電腦,透過這些裝置,我們能比以往更快速接收瞬息萬變的世界的巨量資訊。因此我認為,現今日常生活中,早已離不開無窮無盡的數字,而我們也需要瞭解數字背後的事實。
一種思考世界的方法
我相信數學提供了一種思考世界的方法,能讓人們瞭解氾濫的資料和複雜狀況,並且避免受到錯誤資訊與錯誤解讀的誤導。我想傳授讀者一些數學技巧,幫助大家透過數學家的觀點,瞭解這個世界。推特非常適合用來傳遞簡短且即時的資訊,但無法讓我這個數學家以喜愛的方式呈現想法。我試著用這本書,寫出我的想法,並且解釋為什麼數學家會如此思考事物。
數學模型以簡馭繁
一切的核心都來自於數學模型的概念。某種角度來說,我們心中都存在事物運作的原理模型。例如,我們都十分清楚物體會因為地心引力而落到地上。但如果不是牛頓一步步推導,將這個想法轉化為數學公式,我們並無法真正「理解」上述現象的物理原理。
模型應當要有兩種功能:首先要能解釋我們手上的資料,再者要能預測尚未遭逢的狀況,理想上還須包含這些預測的準確度的嚴謹校正。數學家通常會找出數字或資料的模式,並且提出可能足以解釋這些模式的理論。例如,借助牛頓公式的計算結果,在阿姆斯壯還未乘坐阿波羅十一號登陸月球時,我們就已經十分清楚月球的重力大小。要是沒有這些公式,美國航太總署還不知道能否建造出可發射到月球的火箭呢。
牛頓說了算
奇怪的是,良好的模型並不一定要「完全」正確。統計學家博克斯有句名言提到:「所有模型都是錯的,但有些模型十分實用。」愛因斯坦的相對論研究成果告訴我們,牛頓公式並非完美無缺,例如,牛頓公式無法解決物體以接近光速移動時所出現的問題。但是在十七世紀,人們還在乘坐馬車和帆船旅行,牛頓公式已經足夠準確,能夠有效預測日常生活中的物體行為。即使到了今天,速度最快的火箭也遠不及光速,因此從務實的觀點來看,完全符合阿波羅八號太空人安德斯說過的名言:「太空船怎麼飛,牛頓說了算。」
疫情模型也是類似狀況,雖然那些描繪新冠肺炎傳播狀況的數學模型過於簡單,忽略了真實世界的某些影響因素,但如果模型足以產出可靠的短中期預測,就很可能已足以實際應用。
相關概念就是所謂的「玩具模型」。玩具模型意指完全抽象、且與真實世界差異甚大的模型,但卻足以顯現出真實世界的某些性質。大家可能聽過一則聲名狼藉的杜撰故事。有人拜託一名數學家提供乳牛農場設計建議,數學家給出的模型寫到:「考慮一隻完美球形光滑無摩擦力的乳牛,在零重力的空間中……」
儘管如此,精心挑選的玩具模型,確實能夠在思考真實世界時,派上用場。譬如,我花了不少時間思考,如何利用逐步給予每人一頂能立即阻擋病毒的帽子的假想情境,找出資料中呈現的新冠肺炎疫苗效果。(第3章在對數刻度圖上繪製資料數據時,就能看到明顯效果。
利用模型得出洞見
對數刻度圖上,會看到一條逐漸變得陡峭的曲線。英國2021年春季的新冠肺炎死亡人數資料,也能看到相同效果。雖然模型的假設無疑過於簡單,但是仍提供了一個發現疫苗效果的方法。)如果我們能將真實現象的關鍵要素,抽象化之後,放進這類簡單模型中,然後利用模型得出洞見,這些洞見就能夠帶回日常生活中應用。當然,我們仍須注意玩具模型的有效程度。
市面上已經有許多推廣數學的好書,但往往將焦點放在怪誕或奇特的主題,例如,索托伊的《尋找月光》和賽門.辛的《費瑪最後定理》,或者關注數學與物理之間的關係,例如,法米羅的《宇宙用數字說話》。
大多數人往往會將數學簡單理解為解謎或玩弄數字的遊戲,這是數學家兼喜劇演員帕克最擅長的伎倆。數學確實可以非常好玩,而數學遊戲也是吸引人們學習數學的絕佳方法。但我認為大家同時也要知道,數學十分重要,數學是推動現代世界發展不可或缺的一環。數學是理性解釋事物的實用工具,我會在書中幫助大家瞭解數學如何做到這一點。
瞭解世界變化的結構
這本書中並沒有充斥著公式和希臘字母,事實上,書中幾乎找不到幾條公式。這是一本探討數學思維的書籍,並非一本代數問題教科書。如果可以的話,我寧可畫一張正確的圖表來解釋事物,而非提供一連串複雜的計算過程。我也知道讓大家親自動手算數學,學習效果遠勝於聽老師講數學。因此,每一章最後都會附上「課後作業」,提供方法讓大家測驗是否瞭解該章的內容及進一步探索該章主題。課後作業雖然不會有人批改,但我很樂意知道大家做得如何。
本書大致分為三大單元,每個單元各四章。第一個單元處理「結構」。數學是瞭解世界如何運作的絕佳工具,原因之一是許多重要萬物的運作過程都遵循了幾個簡單規則,而數學則能做為呈現規則的語言和表述方式。因此理所當然,基本物理定律會使用數學公式來表達。
然而,我們往往無法直接觀察到,關心的事物背後所遵循的科學定律。我們往往只能看到一個行為的某個瞬間,並且藉由思考這類過程一般的行為模式,以及驅動這些行為的規則,來設法推論發生的狀況。
第1章〈一張好圖勝過千言萬語〉中,我會說明為何將資料畫在圖表上,是瞭解事物狀況的絕佳切入方法。然而,這個方法必須小心使用,因為資料中的短期模式可能會誤導我們做出過度自信的預測。
令人眼花撩亂的資料
第2章〈在合理範圍內估算〉將會回頭探討數字本身。生活在現代世界中,我們總是不斷接收到各種令人眼花撩亂的資料,包含最新經濟數字、科學發現、民意調查和體育比賽統計數據等等。我將會提供一些更清楚瞭解這些數字的祕訣,包含如何得到這些數字的近似值,並且針對複雜量值做出合理的粗略估算。
第3章〈對數刻度下的指數成長〉將會介紹「指數成長」的概念,無論是在足球員轉會費、細菌繁殖或核反應中,都會出現指數成長。然後我會演示如何使用數學家稱為「對數刻度」的方法,在圖表上呈現指數成長。我將解釋這樣的呈現方式,如何提供我們新冠肺炎疫情和股市行為的相關洞見。
第4章〈跟著規則走〉,我將說明:遵循簡單規則的系統如何表現出複雜行為。我將藉由討論鐘擺運動及介紹由嘗試預測天氣而發展出的數學領域,說明這類數學模型如何呈現許多過程的運作方式。
人類的直覺易受到隨機性誤導
前幾章已經提到數學能夠呈現和說明結構,而接下來將離開這類井然有序的世界,或許會讓大家感到有些矛盾。然而事實證明,這些時常矛盾的現象也可以使用類似的工具來解釋。這些現象與第二單元將深入學習的「隨機性」息息相關。
人類的直覺往往會受到隨機性誤導。例如,如果31號連續在最近兩星期的樂透號碼中開出,有些人可能會認為這星期再開出31號的機率較低(因為平均來說,各事件的出現次數會達到平衡);但有些人可能會認為出現機率反倒較高(因為31號球明顯更容易抽中),然而實際上,抽中31號球的機率根本不會改變。人們往往會在模式根本不存在時,說服自己相信這些事物存在某種行為模式。藉由瞭解隨機性,包含預期的行為和可能出現的極端狀況,大家就能更清楚看透這類問題。
第5章〈隨機散布的資料〉將介紹人類活動中的隨機性這個重要概念。藉由思考簡單的丟硬幣問題,我們將會瞭解重複足夠次數的實驗後,平均會出現的結果。
第6章〈絕對要學會的統計方法〉以隨機性為基礎,說明統計學的「信賴區間」等概念。信賴區間即以數學方法表達事物潛在的不確定性,並讓我們據此做出重大決定,例如是否批准新藥上市等等。
第7章〈條件機率與貝氏定理〉說明了如果將現有資料納入考量,正確思考機率的話,會如何得出許多重要問題的洞見。例如,我們將會瞭解應該對新冠肺炎的檢測結果抱持多大信心,以及如何診斷公司招募程序中出現不平等的原因。
賠率的思考方式
第8章〈發生比與成長曲線〉以博弈公司提供的賠率為出發點,從另一個面向討論機率。我們可以自然而然在機率和賠率之間轉換,而博弈公司的賠率往往更容易實際應用。賠率的思考方式幫助圖靈與他在英國布萊切利園的同事,破解了恩尼格瑪密碼機。而我還會說明,賠率(發生比)在瞭解醫學檢測以及預測新產品市占率、或新冠病毒變種隨時間經過的變化上,能提供我們什麼更好的方法。
分辨資訊和錯誤資訊
在瞭解「結構」和「隨機性」之後,書中的第三單元將說明「資訊」,這是以數學方法瞭解現代世界的最後一個關鍵環節。資訊和不確定性是日常通訊和媒體消費的基礎,可以使用數學量值「熵值」來量化。我們將會瞭解資訊如何變成錯誤資訊、資訊如何幫助我們瞭解股市和疫情的演進,以及如何變成大家都想競爭的資源。這些議題同樣都可以使用數學架構來呈現。
第9章〈資訊就是力量〉,我將會介紹我的數學偶像:向農(Claude Shannon)。我會解釋向農的研究成果,如何引導我們思考接收到的新聞資訊,以及向農的想法如何鞏固手機和資料下載的世界,還有啟發出乎意料高效率的病毒檢測方法。
第10章〈漫步、排隊和網路〉說明搖搖晃晃從酒吧走路回家的醉漢,如何幫助我們瞭解謠言或電腦病毒在連結網路上傳播的方法。這類行為同樣雖然隨機、但卻能夠預測,而瞭解這類行為的性質,能讓我們更深入探索隨機的世界,這可遠比丟硬幣還要複雜得多。
賽局理論
第11章〈搞懂測量方法〉進一步討論隨機性和雜訊問題。本章內容說明了我們如何欺騙自己相信資料存在著模式,以及資料測量和發布的方式,也可能導致我們得出錯誤結論。藉由瞭解這些問題,就能更清楚瞭解帶有複雜訊息的新聞事件。
第12章一如章名〈賽局理論〉,就在說明這套理論。賽局理論探討了人們彼此間合作和競爭的問題。賽局理論的數學概念可以應用在經濟學和生物學上。賽局理論告訴我們,這類狀況下的正確策略,往往包含了混合行動。
最後,第13章〈從錯誤中學習〉是本書的結論,呼籲大家在思考複雜狀況時要常保謙虛。我討探了許多可能會讓大家誤解現狀的因素,並且提供一些避免這些錯誤的建議。
培養獨立理解事物的能力
雖然這本書是受到對新冠肺炎危機的反思所啟發,但內容並不是都在探討疫情。早在媒體開始討論「傳染數」(R number)和「群體免疫」以前,就已經有很多精采的書籍探討過疾病和感染了。雖然這本書裡舉的某些例子是在疫情期間出現的現象,但也有取自更多其他情境的例子,我將會利用這些例子來說明數學家和統計學家如何思考問題。
熟悉數學工具
我將使用這三個單元來說明這一套數學工具,第一單元將帶領大家瞭解世界變化方式背後的結構原理;第二單元將教會大家理解支配事物報導方式背後的隨機性和不確定性;第三單元將告訴大家如何分辨資訊和錯誤資訊。
只要大家掌握了這些思考方法,就會發現世界上有許多事物都能夠使用這些數學方法來理解。我們無法預測接下來十年間會發生什麼重大事件,但無論發生什麼事,熟悉這套數學工具就能夠更容易理性分析,並且能夠區分訊號和雜訊。
如果這本書能幫助大家培養出數學思考習慣,並透過數學家的視角審視最新資訊,相信大家就已經具備獨立理解事物的能力了。(章文/輯)
《社會菁英必備的數學素養》
作者:奧利弗.強森(數學學院統計科學研究所所長)
出版社:天下文化