辨識大躍進 電腦「看圖說故事」

陳彥驊 2014/11/19 11:38 點閱 4222 次
研發中的人工智慧,在搜尋、分析圖片方面將能更精確。〈photo by 網路截圖〉
研發中的人工智慧,在搜尋、分析圖片方面將能更精確。〈photo by 網路截圖〉

【台灣醒報記者陳彥驊綜合報導】使用文字搜尋圖片的惱人情況將可望改善。Google與史丹佛大學聯合做研究,使用較強大的運算能力,試圖設計出能夠精確辨識圖片中物體狀態的技術。技術公開問世後,將能提升使用文字搜尋圖片的效率,也讓圖片內容能被準確辨識,使用者從運算出的文字敘述,可輕易理解圖片內容。

現行的軟體具圖片辨識功能,但仍無法對圖片內容做出完整描述。如「矮子與馬」等,這類簡短卻不知所云的描述,無法讓使用者知道圖片真正的意思。

Google及史丹佛大學日前共同針對電腦偵測圖片內容的功能做研發,已有突破性的結果,未來將運用在日常生活中。研究人員結合圖片辨識及自然語言處理等2種不同的網路系統,並用短句描述出圖片內容。自然語言處理是指,將電腦中數據轉化的資料,轉換為人類可理解語言的過程。

該研究項目針對將人工智慧在圖像中辨明物體的功能做改進,並以使用者可以理解的語言,對圖片內容做出描述。不僅是提出如「有1輛摩托車和1個人在照片中」的類似描述,該技術能針對圖片中人物具體行為描述出「有1個男人正在充滿泥濘的道路上,騎乘摩托車筆直的前進」這樣的內容。

研究人員運用現行技術2倍的運算能力進行,讓該技術有足夠能力完整分析出圖片中物體的確切狀態。如此需要龐大的圖片運算能力,也成為該技術的最大阻礙。目前該技術仍錯誤頻傳,研究人員仍需持續修正,才有辦法正式應用在生活中。該技術運用在搜尋功能後,預期將改變搜尋方式,且使用者以圖片進行搜尋功能也將有更大的進展。

當使用者不需要看著圖片或螢幕的情況下,由人工智慧準確告知在圖片上所偵測到事物的功能,將可協助視障盲胞理解圖片內容,是一大突破。