辨識大躍進電腦「看圖說故事」

研發中的人工智慧，在搜尋、分析圖片方面將能更精確。〈photo by 網路截圖〉

【台灣醒報記者陳彥驊綜合報導】使用文字搜尋圖片的惱人情況將可望改善。Google與史丹佛大學聯合做研究，使用較強大的運算能力，試圖設計出能夠精確辨識圖片中物體狀態的技術。技術公開問世後，將能提升使用文字搜尋圖片的效率，也讓圖片內容能被準確辨識，使用者從運算出的文字敘述，可輕易理解圖片內容。

現行的軟體具圖片辨識功能，但仍無法對圖片內容做出完整描述。如「矮子與馬」等，這類簡短卻不知所云的描述，無法讓使用者知道圖片真正的意思。

Google及史丹佛大學日前共同針對電腦偵測圖片內容的功能做研發，已有突破性的結果，未來將運用在日常生活中。研究人員結合圖片辨識及自然語言處理等2種不同的網路系統，並用短句描述出圖片內容。自然語言處理是指，將電腦中數據轉化的資料，轉換為人類可理解語言的過程。

該研究項目針對將人工智慧在圖像中辨明物體的功能做改進，並以使用者可以理解的語言，對圖片內容做出描述。不僅是提出如「有1輛摩托車和1個人在照片中」的類似描述，該技術能針對圖片中人物具體行為描述出「有1個男人正在充滿泥濘的道路上，騎乘摩托車筆直的前進」這樣的內容。

研究人員運用現行技術2倍的運算能力進行，讓該技術有足夠能力完整分析出圖片中物體的確切狀態。如此需要龐大的圖片運算能力，也成為該技術的最大阻礙。目前該技術仍錯誤頻傳，研究人員仍需持續修正，才有辦法正式應用在生活中。該技術運用在搜尋功能後，預期將改變搜尋方式，且使用者以圖片進行搜尋功能也將有更大的進展。

當使用者不需要看著圖片或螢幕的情況下，由人工智慧準確告知在圖片上所偵測到事物的功能，將可協助視障盲胞理解圖片內容，是一大突破。

台灣醒報

最新熱門

熱門新聞

熱門副刊文章