近幾年常看到各種名人照片或影片,今天是川普唱歌,明天是梅克爾裝鬼臉,後天不知道是誰。乍看之下天衣無縫,真以為名人也會不顧顏面、公開搞笑。其實這是人工智慧被應用在影像處理的例子,而且也已經應用在真實的工業場景中。
就像小孩一樣,人工智慧也需要從大量正負樣本之中學習,才能學到正確知識。特別是在計算機視覺領域,非得看到具體的缺陷才學得到特徵。首先,缺陷品的取得就是個大問題。因為,工業領域裡面只有允交品和下腳料兩種結果,前者交給客戶,後者交給回收業,產品很快就換成現金,不會留下來當庫存。
其次,如果仔細檢查,就算客戶允收的成品都也有大大小小的缺陷,差別只在客戶沒舉手質疑。這意味著,良品與缺陷之間很難畫出界線,甚至昨是今非、一日數變。
這兩個因素造成機器學習的根本困境,首先難以取得足夠樣本,就算有樣本,標準也會隨著經營目標不斷變動,換句話說,如果觀念不變,人工智慧也枉然。
歸根結底,要得到有應用價值的模型,要先克服兩件事情,一、如何得到足夠的缺陷,二、如何建立可調整的標準。
目前這兩件障礙都已經有了解決方案,特別是在如何得到缺陷特徵這件事情上——「缺陷生成」是個被技術長高度重視的方向。
這件事說到底就是將已知缺陷移植到良品的影像上,而且做到以假亂真的地步。
好奇同學舉手問,「如果不像怎麼辦?」,「很簡單,剔除」。人工智慧的做法是,自備裁判。先讓裁判認識什麼是真實的缺陷與良品,然後讓選手努力生產影像,連裁判都分不出真假的影像,才算合格。
這樣的做法等於讓雙方彼此對抗,一邊想盡辦法要騙過對手,而對手則是極度挑剔,絕不輕易放過。對抗的結果就是憑空生出一批難分真假的影像,成為訓練人工智慧的教材。
對於決策者來說,這個方法可謂高效率投資,因為過去要大費周章才能收集足夠樣本,但現在可以非常經濟地取得素材。讓人工智慧在工業場景中落實的日子又近了些。