《工業4.0省思之三》假到極致便是真

近幾年常看到各種名人照片或影片，今天是川普唱歌，明天是梅克爾裝鬼臉，後天不知道是誰。乍看之下天衣無縫，真以為名人也會不顧顏面、公開搞笑。其實這是人工智慧被應用在影像處理的例子，而且也已經應用在真實的工業場景中。

就像小孩一樣，人工智慧也需要從大量正負樣本之中學習，才能學到正確知識。特別是在計算機視覺領域，非得看到具體的缺陷才學得到特徵。首先，缺陷品的取得就是個大問題。因為，工業領域裡面只有允交品和下腳料兩種結果，前者交給客戶，後者交給回收業，產品很快就換成現金，不會留下來當庫存。

其次，如果仔細檢查，就算客戶允收的成品都也有大大小小的缺陷，差別只在客戶沒舉手質疑。這意味著，良品與缺陷之間很難畫出界線，甚至昨是今非、一日數變。

這兩個因素造成機器學習的根本困境，首先難以取得足夠樣本，就算有樣本，標準也會隨著經營目標不斷變動，換句話說，如果觀念不變，人工智慧也枉然。

歸根結底，要得到有應用價值的模型，要先克服兩件事情，一、如何得到足夠的缺陷，二、如何建立可調整的標準。

目前這兩件障礙都已經有了解決方案，特別是在如何得到缺陷特徵這件事情上——「缺陷生成」是個被技術長高度重視的方向。

這件事說到底就是將已知缺陷移植到良品的影像上，而且做到以假亂真的地步。

好奇同學舉手問，「如果不像怎麼辦？」，「很簡單，剔除」。人工智慧的做法是，自備裁判。先讓裁判認識什麼是真實的缺陷與良品，然後讓選手努力生產影像，連裁判都分不出真假的影像，才算合格。

這樣的做法等於讓雙方彼此對抗，一邊想盡辦法要騙過對手，而對手則是極度挑剔，絕不輕易放過。對抗的結果就是憑空生出一批難分真假的影像，成為訓練人工智慧的教材。

對於決策者來說，這個方法可謂高效率投資，因為過去要大費周章才能收集足夠樣本，但現在可以非常經濟地取得素材。讓人工智慧在工業場景中落實的日子又近了些。

台灣醒報