1950年計算機先驅圖靈提出一個測試電腦是否具備足夠智慧的方法,就稱之為圖靈測試(Turing Test),計算機科學家用圖靈測試來確定機器是否能夠顯示出足夠令人信服的人類智慧水準,以欺騙另一個人相信它也是人類。這通常是透過一個「模仿遊戲」(Imitation Game)來實施完成的。
通過圖靈測試
遊戲是這樣進行的:總共有三個玩家,一名玩家無法看到其他兩名玩家,但可以透過提問來與他們互動和交流,目的要確定看不到的兩名玩家中的哪一個是人類,哪一個是機器。當這名玩家無法區分看不見的玩家到底是人類或計算機時,就說計算機通過了圖靈測試。
前一陣子一位谷歌工程師聲稱,他花了數月時間測試的人工智慧聊天機器人LaMDA具有感知,具備人類的一些感情的能力,例如害怕死亡。儘管谷歌堅持認為它還沒有那麼厲害,但無可否認的,對話式機器人的交談能力已經愈來愈進步,更容易通過圖靈測試。
測試顏色反應
最近意大利的研究人員訓練了一個人工智慧程式來從事另一種形式的圖靈測試。在實驗中,一個人和一個機器人都必須觀察銀幕上的彩色形狀,人和機器對不同的顏色做出反應。例如,人的任務是僅在銀幕上出現紅色方塊時按下他們的按鈕,而機器人是僅在銀幕上出現綠色方塊時按下他們的按鈕。
但機器人是透過遠端的真人或人工智慧程式來控制的。亦即有時是遠端的真人叫機器人去按鈕,有時是由人工智慧控制機器人來按鈕。重點是人工智慧設計考慮到人類的反應時間,並隨機改變其在看到形狀和按下按鈕之間的反應時間,以顯得更人性化。
半過的人會猜錯
事後人類參與者被要求猜測他們的機器人隊友是由另一個真人還是由人工智慧所驅動。如果是真人人們通常可以分辨出來,但若是人工智慧程式在背後操控,就有超過一半的時候人們會猜錯。
研究結果表明,若人工智慧在功能上可以參考人類的行為學,例如注意力不可能時時百分之一百集中,那麼就可以更容易讓人類在不知底細的情況下分不清楚真實的狀況,這可以給未來設計對話機器人的參考。
人工一般智慧
這不是機器第一次通過圖靈測試。2014年在英國雷丁大學舉辦的一次活動中,一個計算機程式使倫敦皇家學會三分之一的人類評審委員相信這是一個13歲的男孩。
然而許多科學家指出,雖然通過圖靈測試是一個有意義的里程碑,但由於圖靈測試只是用簡單的對話和類似聊天的方式,它不能用來真正衡量人工智慧機器是否真的有人類的智能,因此還不能用來證明人工智慧可以真正具備人類的思考和創造的能力,以達到人工一般智慧(AGI, Artificial General Intelligence)的境界。