人類與人工智慧之戰 不是零和賽局

醒報編輯部 2019/08/12 11:41 點閱 3301 次

最人模人樣人類獎

我在離家5千哩的旅館醒來,浴室沒有蓮蓬頭,我只好15年來第一次泡澡。早餐頗為老派:幾個看來有點嚇人的烤番茄,一勺焗豆,兩片對半切好的土司排在小鐵架上,平平整整地像一列書。

吃完後我一腳踏進略帶鹹味的空氣,信步晃到海邊走走。我的母語是這個國家發明的,不過路邊的標語我多半看得霧煞煞。就拿「LET AGREED」來說好了,字體大得唯恐天下不知,乍看之下好像很威風,可是我完全不知道那是什麼意思。

我停下腳步呆望大海,在腦子裡翻來覆去思索那個標語的意思。

我平常就對語言問題很感興趣,對文化差異也相當好奇,但今天,我得認真運用這份嗜好做件大事:接下來兩個鐘頭,我會在電腦前面嚴陣以待,用即時通訊軟體跟幾個陌生人聊天,每一個各聊五分鐘。

傳輸線另一頭是評審團,包括一位心理學家、一位語言學家,以及一名英國大眾科技節目主持人,而我得透過這些對話達成的任務,絕對是我這輩子最詭異的目標之一——。說服他們我是個人。幸運的是,我的確是個人;不幸的是,我不見得能讓他們相信我是人。

圖靈測驗

人工智慧(AI)族群每年都會舉辦這個領域最吸睛、也最受爭議的比賽——圖靈測驗。這個測驗以英國數學家艾倫・圖靈為名,他是電腦科學的開創者之一。1950年時,他嘗試回答這領域裡最早的問題:機器會思考嗎?換個方式說:我們可不可能造出一台夠複雜的電腦,精巧到能說它能思考、有腦袋,甚至有意識?此外,如果有一天真的出現這種機器,我們怎麼知道它有這個能耐?

圖靈不打算從純理論層次探討這個問題,相反地,他提出一項實驗:分別讓電腦程式和真人擔任參賽者,再由評審團透過電腦終端機向他們提問,在問答中分辨哪個是人,哪個是電腦。

對談內容不拘,可以小聊幾句,可以問具體事實(例如「螞蟻有幾隻腳?」、「巴黎在哪個國家?」),也可以聊名人八卦或嚴肅的哲學問題——總之,只要是人與人之間會出現的話題,評審團全都能問。

據圖靈預測:到2000年時,電腦就能在閒聊5分鐘後騙過3成的評審。若能達成這項目標,「我們就能大聲說機器能夠思考,不必擔心受到質疑。」

雖然圖靈的預言尚未實現,但已近在咫尺:在2008年於英國瑞丁舉行的比賽中,電腦程式僅以一票之差落敗。換句話說,2009年在布萊頓的比賽很可能是關鍵之役。

與AI正面對決

我正是為此來到英國。我要和其他3名人類參賽者一起,與世界頂尖的AI程式正面對決(或者該說鍵盤對決?)。每一回合,我和其他參賽者都會和一個AI程式配對競爭,爭相說服一位評審我們才是貨真價實的人類。

評審會和其中一個「選手」聊5分鐘,然後再和另一個聊5分鐘,接著有10分鐘思考哪個應該是真人。除了投票認定孰真孰假之外,評審也會以分數表明對自己的判斷有多大信心,如此一來就更不必擔心分不出高下。不論有沒有程式「通過圖靈測驗」(亦即騙過3成評審),比賽都由得到最高票和最多信心分數的程式獲勝,並頒發「最人模人樣電腦獎」。

研究團隊奮力爭取的就是這份榮譽(當然也有獎金),主辦單位和觀眾最關注的也是這個獎獎落誰家。但除此之外,這個比賽也挺幽默地準備了另一個獎給參賽人:獲得最高票和最多信心分數的人,可以贏得「最人模人樣人類獎」。

1994年,這個獎由《連線》雜誌專欄作家查理・普萊特奪下,他也是最早的獲獎者之一。他是怎麼脫穎而出的呢?他說訣竅是表現得「情緒化一點、暴躁一點、惹人嫌一點」——我簡直不敢相信我的耳朵,這未免太搞笑也太悽慘了吧?不過,我被這樣一激反而開始思考:我們該怎麼做才能讓自己更像人呢?——而且不只在這個測驗設定的條件之中,也在日常生活之內?

毛遂自薦

圖靈測驗比賽的正式名稱叫羅布納獎,出錢出力的舉辦者是個既有趣又有點怪的人:塑膠製可捲可攜迪斯可舞池地板大亨休・羅布納。有人問過他為什麼願意投入時間和金錢籌劃比賽?

他說最大的原因是懶:在羅布納先生的夢想烏托邦裡,失業率顯然是百分之百,所有需要人付出精力的事情統統外包,全丟給智慧型機器處理就夠了。我得說:這樣的未來對我實在沒吸引力。

電腦重塑自我意識

對於AI普及的世界該是什麼樣貌,我的想法和羅布納不同,我想參加圖靈測驗的原因也不一樣。但無論如何,我們顯然都很在意的關鍵問題是:電腦或如何重塑我們的自我意識?這個過程又會帶來何種結果?

我完全不曉得該怎麼報名參賽,所以我直搗黃龍——試著向休・羅布納本人問問。我一下子就找到他的網頁,匆匆一掃發現簡直是大雜燴:有關於伸縮欄柱的資訊,有性工作倡議活動,有爆料奧林匹克獎牌成分不純,喔,對了,還有以他為名的那個獎的資訊——以及他的電郵地址。

他回信要我去找薩里大學教授菲利浦・傑克森,今年是由他負責統籌羅布納獎的幕後工作。2009年的比賽將由Interspeech語言與通信科學會議主辦,預計在布萊頓舉行。

我用Skype跟傑克森教授講上了話。這傢伙年輕、聰明又滿腔熱血,一看就是那種爆肝當進補的學術界新人。這種態度加上他那迷死人的英國腔(例如把「skeletal」說得跟「a beetle」成韻),我馬上就喜歡上這個人。

他問了些我的事,我說我是非虛構寫作者,報導領域以科學和哲學為主,我尤其關注科學和哲學在日常生活中的交集,還有我對圖靈測驗和「最人模人樣人類獎」非常感興趣。我覺得人和機器對決聽起來很酷,頗有幾分「人類榮辱就在我肩上」的英雄氣概,就像加里・卡斯帕洛夫對戰深藍,還有益智節目之王肯・詹金斯對戰IBM電腦「華生」。

人類與AI之戰

我也忍不住想起《魔鬼終結者》和《駭客任務》的幾個場景——人類與AI之戰多有血性、又多可歌可泣啊!(只不過機關槍在圖靈測驗裡顯然毫無用武之地)。所以2008的比賽結果簡直讓我捶心肝:一票,就差那麼一票,機器就能通過圖靈測驗了!我霎時想到2009可能就是它們侵門踏戶的關鍵時刻,正要頓足長嘆,內心深處卻傳來堅毅淡然的聲音:只要有我在,它們想都甭想。

透過報導接觸到議題

除了事關人類面子之外,這個測驗也同時牽涉電腦科學、認知科學、哲學和日常生活領域,其所引發的問題雖然有趣卻也讓人不安。這些領域我都有研究也都有寫過,我甚至還發表過通過同儕審核的認知科學論文,而圖靈測驗呢——簡直像是設計來貫串這些領域的。我對傑克森教授說:我覺得自己不論是實際參加比賽,或是從更廣闊的角度把相關議題報導出來,都能為羅布納獎帶來不一樣的東西。我也相信:如果有更多人透過報導接觸到這些議題,一定能為大眾文化帶來良好而深遠的改變。傑克森似乎相當認同我的想法,馬上答應讓我參賽。

跟我稍微介紹這個比賽的相關事宜後,他給我的建議跟我預料中一模一樣:「不用想太多。你本來就是人,做你自己就好。」我之前已經問過以往參賽者的意見,他們也是這樣講。

AI龐大的資料庫

「做你自己就好」,是啊,從1991年羅布納獎首次舉辦開始,參賽者的口號就是這個,但在我看來,這似乎對人類本能太有信心了點,自信得近乎天真——說難聽一點,簡直讓參賽者難以發揮。我們自己固然花了幾十年才變成現在的樣子,但我們的AI對手可是科學家幾十年來的心血結晶。

AI研究團隊有龐大的資料庫不斷測試程式,也會認真分析測試結果,為比賽做足準備。他們了解該如何巧妙引導對話,知道該怎麼轉移不擅長的話題,盡可能讓程式發揮長處。他們當然也研究過怎麼勾起評審的談興,怎麼聊又會聊不下去——我就直說了吧:我們要是吊兒啷噹地只帶個「本能」跑去參賽,實在不是個好主意。光是看看以「約會教練」為業的人有多少,就知道我們社會多需要談話和公開講話的能力,所以,爭奪羅布納獎怎麼能只「做自己」呢?

我覺得這個建議很怪,但也饒富深意。2008年的比賽紀錄正好說明了這點:評審們覺得對人類參賽者不太好意思,因為他們的對話枯燥無比——「我覺得對參賽者有點抱歉,老是談天氣一定讓他們覺得很無聊。」另一位評審說得比較委婉:「抱歉,我這個人有點乏味。」在此同時,螢幕另一頭的程式顯然迷倒評審,還狂丟表情符號——真的,我們人類可以表現得更好。

所以,我老實招認:我從一開始就打定主意不甩籌辦者的建議。「只要九月記得去布萊頓,然後做你自己就好啦。」——呿!我比賽前要做的事可多了,我打算盡可能做好準備、收集資訊、聽取經驗,到了布萊頓我要火力全開。

證明自己很有人樣

一般來說,做好準備是基本常識。不管是參加網球比賽、拼字比賽,還是考入學測驗,沒有人會毫無準備隨便應付。圖靈測驗有什麼不一樣嗎?既然它的目的是評估我有多像人,應該代表做人(還有做自己)不只是記得出席而已。至少我覺得不是人到就好。那麼,除了出席之外,我該怎麼證明自己很有人樣呢?這就是這本書的主旨了。我也認為:這一路上所找到的答案,絕不僅止於挑戰圖靈測驗而已——它們對人生更有意義。

##愛上伊凡娜

來說一個詭異又超級諷刺的警世故事:羅伯・艾普斯坦博士是加州大學聖地牙哥分校心理學者,著有《爬梳圖靈測驗》,同時也和休・羅布納共同創辦羅布納獎。

艾普斯坦博士在2007年冬加入一個線上約會網站,開始寫長信給一位名叫伊凡娜的俄國女子。這名女子剛開始也總回長信,娓娓道出自己的家庭背景和生活點滴,也款款傾吐她對艾普斯坦日益深厚的情感。可是不知怎的,伊凡娜的信越寫越短,互動也越來越不對勁,艾普斯坦最後總算恍然大悟:原來他掏心掏肺寫了四個月情書,追到了一個——是的,你猜到了——電腦程式。

淒涼啊,淒涼,每天被垃圾郵件疲勞轟炸還不夠嗎?那群網路混帳不但攻陷他的信箱,還攻陷他的心。

某方面我只想翹起二郎腿恥笑這個傢伙——我的老天鵝啊,這個歐吉桑創立了羅布納獎耶!是有沒有這麼蠢啊?但笑完之後,我還是挺同情他的:21世紀是垃圾郵件鋪天蓋地的世紀,它們像蟑螂一般爬滿你的信箱,像攔路虎一樣霸佔你的頻寬(垃圾郵件大約佔全部電郵的九成七,意思是每天有幾百億封垃圾郵件四處打劫,全世界每天用來處理垃圾郵件的電量都夠小國用了)。

##垃圾郵件惡劣影響
不僅如此,垃圾郵件還有更惡劣的影響:它會逐漸侵噬我們的信任感。我恨透了收到我朋友的訊息還得確認一下是不是真的是他們寫的,哪怕確認一下只需要花我兩秒鐘,哪怕我只要讀幾行就能判斷真偽,我還是厭惡透了幹這種事。21世紀的數位生活讓我們不得不提高警覺,於是所有的溝通都成了圖靈測驗,每次溝通我們都得留份戒心。

這是數位生活比較負面的版本,當然還有較為正面的版本。我敢打賭艾普斯坦有學到教訓,而且這一堂課意義深遠,絕不只是「想跟住下諾夫哥羅德的某人發展關係是蠢事」而已。我想他起碼會好好想想自己為什麼會上當,為什麼會花了四個月才發現他和「伊凡娜」之間沒有火花。

要是他以後又在網路上找到一位靈魂伴侶,應該會想趕快跟她碰個面吧?但願他的下個女友是位善良誠懇的智人,住得離他近一點,起碼不要一隔隔了十一個時區。如果他們終成眷屬,我想那位女子會感謝「伊凡娜」教了她另一半一課。

貝蒂傳說

克勞德・夏農在貝爾實驗室邂逅貝蒂時是1940年代,貝蒂就是傳說中的「computer」。我們現在聽來可能覺得頗為古怪,但那時毫無引人側目之處。他們的同事對這種組合習以為常,在貝爾實驗室裡,這甚至是典型的愛情故事:工程師和computer向來是天造地設的一對。

艾倫・圖靈在1950年發表〈電腦與智能〉,這篇論文開啟了我們認識的AI領域,也引發了圖靈測驗的爭議(圖靈測驗亦稱「模仿遊戲」,這是圖靈提出時給它的稱呼),相關討論至今未歇——只不過,圖靈說的「computer」和我們現在理解的不同。

21世紀的「computer」是數位程序處理機,不但辦公室裡看得到,家裡和車上也有,連口袋裡都找得到,放眼望去到處都是。可是在20世紀初,「computer」不是機器,而是職稱——計算師是也。

計算師

從18世紀中葉開始,計算師就是公司行號、機械工廠和大學院校的常備員工,通常由女性擔任。他們負責計算工作和數據分析,有時也會使用早期計算機。從首次運用牛頓引力理論預測哈雷彗星的折返時間(在此之前,這只能以行星軌道檢證),到曼哈頓計畫造出第一顆原子彈(在洛斯阿拉莫斯,諾貝爾物理獎得主理查・費曼帶領一群計算師參與計畫),凡是與數字有關的任務,背後一定有這群人類「computer」的身影。

回頭看看電腦科學最早的幾篇論文很有意思,你會發現那些作者絞盡腦汁,很想解釋清楚這種新玩意兒究竟是什麼名堂。拿圖靈的那篇論文來說,他把這種聞所未聞的「數位電腦」比作人類計算師:「或許可以這樣解釋數位電腦背後的概念:只要是人類計算師能做的工作,這種機器都能做。」

假作真時真亦假

當然,幾十年後的我們已經知道,「computer」的指涉現在倒過來了:如今數位電腦才是「computer」這個字的正主,說某人是「computer」反倒不倫不類。在20世紀中,對尖端數學機器的最高讚譽是「像計算師一樣」,但到了21世紀,我們是誇心算天才「簡直跟電腦一樣」。詭異吧?我們當初想發明一種像人類的東西,現在卻是誇獎人類像那種東西。換言之,我們在模仿以前模仿我們的東西。在尋找人類獨特性的漫長歷史上,這大概是最奇怪的倒轉之一。

定義人類

哈佛大學心理學家丹尼爾・吉伯特(Daniel Gilbert)講過:心理學家在職涯生活的某個階段,多半會提出自己的人類定義。格式是這樣:「人類是唯一一種會__的動物」。壯哉斯言!不過,打從人類有歷史以來,好像哲學家和科學家都和心理學家一樣愛湊熱鬧,總對改寫這個定義樂此不疲。然而我們可以中肯地說:人類自我感受的歷史,就是人類定義不斷栽跟頭或被戳穿的歷史。只不過現在更慘,能挑戰這個定義的不只動物而已。

我們一度認為只有人類使用具有語法規則的語言,實則不然;我們一度認為只有人類會使用工具,實則不然;我們也一度認為只有人類會數學,現在我們簡直不敢相信有人比計算機更能算。

回顧歷史

檢討人類定義轉變的方式很多,其中一種是回顧歷史,看看這個定義如何因各種發展而改變(例如我們對世界的了解和科技的演進等等)。從這個角度切入,我們可以探討的是:各種變化如何形塑人類的身份認同?舉例來說:在我們發現創作對電腦多不容易之後,藝術家的價值是否變得比以往更高?

我們最後或許終須自問:我們對於自身獨一無二的定義,難道真的應該被動地隨科技發展而調整嗎?此外,我們為什麼非要覺得自己獨一無二不可呢?

《人性較量:我們憑什麼勝過人工智慧?》
作者:布萊恩‧克里斯汀
譯者:朱怡康
出版社:行路
出版日期:2018/05/09