靠講話過生活 聲控時代來臨

醒報編輯部 2019/08/12 10:47 點閱 3160 次

1990年代,網路世界是一個封閉的地方。許多使用者都用像是美國線上這類入口網站來管理自己的網路瀏覽需求,把資訊都集中在同一個入口網站上,並且列出有用的外部網站,藉此瀏覽體育資訊、金融資訊等。使用者大多都是在封閉的環境裡上網,這種生態也因此稱為「圍牆花園」。

打破圍牆又重建

後來,Google用鐵鎚擊破圍牆,推出搜尋引擎,讓大家可以自行在網路世界裡輕易找到想要的網頁。從此以後,我們便能在整個網路世界裡自由翱翔。但是過去幾年來,有一件奇怪的事發生了:Google和亞馬遜竟然在重建花園的圍牆。

Google推出即時回答,讓使用者有時候不需要跳出搜尋結果頁面,就可以得到想要的資訊。Google和亞馬遜也都設計出自家的語音助理。語音助理就是一種入口網站,像是數位行銷商Huge的創意總監蘇菲‧柯列伯說道:「Alexa就是語音世界的美國線上。」

語音助理成入口網

Google助理與Alexa平台上許多熱門的應用程式,也都是Google或亞馬遜自行設計的。要用第三方應用程式,使用者必須先經過Google助理或Alexa。例如,使用者通常會用所謂的「呼喚語」呼叫Alexa技能。

使用者可能會說:「Alexa,我要聽《華盛頓郵報》的頭條」,或是「Alexa,玩《危險邊緣》」。同樣地,Google助理的使用者也會說:「打開Yelp」或「ESPN上有什麼新聞?」

使用Alexa的盲點

如果使用者知道自己要用哪一個語音應用程式,這樣的模式就沒有什麼問題;但是如果使用者不知道自己要用的是什麼,會如同矇上眼睛在飛行,就像在沒有搜尋引擎協助的情況下,要找到新的網站。

如果使用者詢問的問題或是說出的指令沒有指明要用哪一個應用程式,Alexa或Google助理就會自行決定該如何回答問題或執行指令。如此一來,Google和亞馬遜就握有強大的權力,能夠主導語音流量的去向。

這樣的模式看起來就很像是以前的圍牆花園,會形成這樣的模式,其實也不一定是因為亞馬遜或Google本身渴望握有控制權,但是這些企業肯定很享受這樣的權力所帶來的利益。在語音的世界裡,本來就適合以單一數位實體掌控一切,Siri的原始研發團隊肯定支持這樣的想法。

語音助手突破規模

如果沒有一個主宰的語音助手,所有的語音應用程式都會是獨立開發,這樣一來,每個應用程式都有自己的名字、自己的獨特功能、自己的一套指令。「我覺得大家不可能記住數萬個不同的名字和數萬套不同的指令。」切爾說道:「這種模式先天就無法規模化。」

切爾與基特勞斯離開蘋果後,創辦Viv。Viv追求的是另外一個目標:創造獨立運作、全知全能的助理。Google和亞馬遜雖然很明顯地漸漸在扮演資訊守門人的角色,但是它們本身不想要被大眾當成資訊守門人。但是Viv不一樣,該公司開宗明義就明白宣告,他們的目標就是要做出全能的助理—終極的電腦,有了它,就不需要其他的電腦了。

的確,Viv的科技其實已和第三方應用程式配合,畢竟切爾一直以來的運作模式都是如此,但是第三方應用程式都是在背後暗中來,使用者不會看到。使用者只會和一個助理互動。Viv在2018下半年推出,裝載在全世界數百萬台三星裝置上。「這是一場競賽。」吉特勞斯說道:「各大企業相爭成為使用者的單一介面。」

盤點各大科技公司

Viv擁有強大的科技,因為它使用的科技是語音助理這個領域最初的先鋒所研發的,但是因為進入市場時間較晚,算是競賽中的一匹黑馬,和其他競爭者競逐成為主導介面。這場競賽在幾年前還似乎比較開放,大家都可以來競爭,但是現在競賽已經比到某種程度,占有優勢的參賽者已經出線了。

現在,我們來盤點每家公司的表現。首先是蘋果,Siri是全世界普及的數位助理,平均每個月接獲的指令數高達一百億則,而且支援20多種語言。這是好消息,但壞消息是蘋果並未遵照原始創辦團隊的構想行事,所以Siri並沒有發揮應有的實力。

Siri一度成眾矢之的

許多科技評論家都開始批評Siri,Siri儼然成為語音人工智慧界的眾矢之的。評論寫道:Siri「很糊塗」又「很難堪」(《華盛頓郵報》);「蘋果錯失的最大契機」(《休士頓紀事報》)「有重大缺陷」(《紐約時報》)。科技分析家傑雷米‧歐陽在接受《今日美國》訪談時表示:「感覺蘋果好像完全放棄了Siri。」

這麼說是有點過頭了,但是蘋果的確該受到批評。蘋果原本是語音人工智慧的領頭羊,但是現在卻落後了。蘋果直到2018年2月才推出自家的智慧音響HomePod,比Google Home慢了將近一年半,比亞馬遜Echo慢了整整3年半。

HomePod推出後,評論家對其音質表示讚賞,但也提到HomePod價格高昂的問題—一台HomePod要價349美元,亞馬遜Echo只要99美元;而且許多評論家也對Siri提出批評,表示HomePod上的Siri性能很差勁。到了2018年6月,HomePod在美國智慧居家音響市場的市占率只有4%。

語音科技價格戰

針對語音科技,蘋果採取的策略其實和公司的本質定位有關。蘋果的本質是電子裝置製造商,因此把Siri當成自家裝置上的優秀功能,而不是把Siri當作獨立出售的產品。然而,Google與亞馬遜都預測在未來環繞運算會成為主流。如此一來,語音科技確實會為蘋果帶來風險。

在未來,聰明的人工智慧住在雲端上,透過價格低廉的商品和使用者講話,而蘋果專門販賣高價裝置,在這種情境下,蘋果的地位會受到極大的衝擊。接下來是微軟。微軟有一個世界級的人工智慧部門,部門裡有8千名員工。

微軟的市占率瓶頸

微軟有搜尋強大的引擎Bing,提升語音助理的問答能力,而且微軟的虛擬助理Cortana已經確立了自己的地位。但是微軟提升Cortana在消費者市場的市占率方面遇上了困難。Bing或Skype都支援Cortana,但是這兩個平台的用戶量卻遠遠不及Google或Messenger。

Windows Phone上也能使用Cortana,但是它的市占率一直無法脫離個位數,甚至只有個位數出頭,所以在2017年停產了。在智慧音響的戰場上,Cortana裝載在哈曼卡頓的智慧音響Harman Karton Invoke裡,但是這款音響的市占率小到幾乎無法計算。開發人員不想花時間為一個很少人用的平台設計語音應用程式,所以大多數都選擇避開Cortana。

儘管面臨這些挑戰,微軟並沒有放棄。Cortana裝載在Windows作業系統上,而且每個月有1億4千5百萬名活躍用戶。微軟並不是把Cortana定位成全能、全民型的人工智慧,而是定位為職場助理,這很符合微軟近期的總體經營策略:專門為企業提供軟體與雲端服務,而人工智慧語音科技就是其中一種。

所以,微軟即便在語音科技的戰場上並沒有總體優勢,但是在企業領域裡,有條件成為一支精實勁旅。

臉書語音較不完整

再來是臉書,臉書在語音世界的未來很難預測。如果說全世界都和中國一樣,有10億人都在用微信,並把微信當成整個網路世界的入口,臉書的條件就很好,因為Messenger上已經有許多強大的機器人。不過,未來的趨勢會不會如此,現在仍然難以預料。

除了Messenger以外,臉書也做了不少對話式人工智慧的研究,但並不是很積極把成果轉換為產品。根據傳聞,臉書已經研發出自己的智慧居家音響,但是後來因為爆發劍橋分析醜聞,引爆隱私爭議,於是便暫緩發表。所以,目前臉書的得分是「不完整」。

Google大戰亞馬遜

剩下Google和亞馬遜。無論用什麼指標衡量,這兩家公司目前是競賽中最具優勢的。2018年,支援Cortana的裝置只有區區39個,支援蘋果和Siri的裝置有194個,支援Google助理的裝置超過5千多個,而支援Alexa的裝置則達到2萬個。

Google助理有超過1700個應用程式,而Aelxa在全球則有5萬個應用程式。在美國,亞馬遜的智慧居家音響市占率為65%,Google則為20%。既然Google和亞馬遜是前兩大競逐企業,最好的評估方法就是檢驗兩家公司分別有什麼方法可以透過語音賺取利潤。

如果你把獲利的問題拿來詢問這兩家公司的高層,他們會緊張地說出一連串的陳腔濫調,表示現在這項科技還處於早期階段,公司目前正在想辦法提升使用者體驗,等使用者體驗做到最好之後,自然就會有獲利。

低價搶市占率

這種回答雖然是在閃避問題,但是其實不假。目前這些公司都在搶地盤,擴大用戶量,因為它們知道擁有主導地位的平台,自然會有各種方法大發利市。但是就連在現階段,公司高層也已經在思考各種商業模式了。最直接的獲利方法,就是藉由販賣裝置賺取營收,亞馬遜賣Echo,Google賣Home。

但是有別於蘋果,這兩家公司對這個選項似乎不是特別感興趣,因為現在它們都刻意壓低裝置的價格,用以提升市占率。有一家獨立研究公司把Echo Dot拆開檢查,評估所有的組件加起來的成本是35美元,加上間接成本與運送費用,總成本還要更高。不過,亞馬遜Echo Dot的定價最低,為29.95美元。

「公司是靠著消費者使用我們的服務賺錢,而不是靠著消費者購買裝置賺錢。」Alexa設計與發表過程負責人葛雷格•說道。下一個獲利選項就是廣告,公司可以付錢給平台,讓語音助理回應前或回應後播放廣告。

下一步是靠廣告獲利

目前Google和亞馬遜尚未開放這種模式,但是在未來,這種模式幾乎是遲早的事,而問題在於,哪家公司會受不了,率先開放呢?「誰都不想成為第一個,因為這樣一來,另外一家公司就會說:『大家快看,他們有打廣告,我們沒有。』」對話式人工智慧創業家亞當‧馬奇克說道。

然而,語音廣告的獲利能力似乎不如線上廣告或手機廣告。在語音的世界裡,廣告欄只有一個,傳統的搜尋引擎則能有很多個。假設你在Google搜尋引擎上查詢便宜的機票,Google就可以丟出4個付費廣告,放在搜尋結果的上方;但是在語音搜尋的世界裡,如果使用者要先聽4則廣告才能聽見一則回答,應該就不會有人想用語音搜尋了。

語音廣告潛力評估

這對Google來說是一大問題,該公司現在大部分的收入都來自廣告,這種廣告模式靠著消費者在搜尋結果頁面駐留,這樣廣告才能曝光。但是早在行動裝置興起後,消費者逗留搜尋結果頁面的時間已經減少了。

隨著語音搜尋的興起,廣告的曝光就會愈來愈少。「如果你是Google,現在就會想著:『哇!如果大家都用語音搜尋,我們傳統的商業模式就沒有了,因為語音搜尋很難做廣告。』」佛瑞斯特研究機構市場分析師詹姆士‧麥奎維說道。

語音查詢購物市場

要透過語音獲利,最大的機會或許就是購物了,這對亞馬遜顯然有利。無論是在家中哪一個地方,你都可以用語音購買東西,可以買紙巾、洋芋片、新的烤麵包機。有一項市場研究指出,語音購物的總產值現在是一年20億美元,到了2022年,則會成長到4百億美元。另外一項研究發現,家裡有Alexa裝置的人,每年花費在亞馬遜商城的錢會比一般消費者多出66%。

亞馬遜的優勢還不只這一點,消費者如果用語音查詢商品資訊或訂購商品,但卻沒有指明品牌的話,亞馬遜就會挑選第一順位的商品。當然,消費者如果聽了不喜歡,也可以請Alexa提供其他選項,但是消費者這麼做的機率極低。這讓許多企業感到害怕,同時也讓亞馬遜握有更大的權力。

企業搶曝光

「如此一來,你買的就不是品牌了。」馬奇克說道:「你買的是亞馬遜叫你買的東西。」廠商的產品如果列在第一順位或前幾個順位,銷售量可能就會比其他排名較低的產品高出許多。

所以許多企業就會樂意付錢給亞馬遜,請亞馬遜把它們的產品放在前面,因為如果自己的商品沒有放在虛擬貨架上,就幾乎等於是不會曝光。再者,亞馬遜也有數量超過100個的自家品牌,從童裝到狗食都有,而且以後會更多。在語音搜尋的商品排行中,亞馬遜大概會優先挑選自家品牌。

亞馬遜尚未公開宣布是否會開放語音搜尋贊助排行,如果要開放的話,就必須秉持公開透明的原則,不然消費者肯定會覺得自己受騙。不過,贊助排行其實也不是什麼新模式,早就有明確的先例了:螢幕版的亞馬遜商城裡,廠商會付費給亞馬遜,亞馬遜就會把他們的商品放在其他搜尋結果的上方。

與敵人企業組聯盟

Google也明白,要透過語音獲利,最好的方法或許就是電子商務。Google找到許多受到共同敵人亞馬遜威脅的企業,並和它們組成聯盟,包括沃爾瑪、塔吉特、好市多、柯爾百貨、史泰博、Bed Bath & Beyond、PetSmart及沃爾格林,這些企業都可以滿足Google語音裝置接到的訂購指令。

此外,Google也可以擴充自己的購物購物—Google購物,讓平台更完善,與亞馬遜競爭。然後,可以採用潛在客戶開發商業模式,Google每把一位使用語音搜尋的顧客導向零售商,零售商就要付費給Google。

總而言之,在語音的競賽中,Google目前排名第2,而且極具潛力,進展快速。不過目前為止,排名第1的仍是Alexa,因為Alexa在市占率與獲利模式的選擇上都占有優勢。「地球上每家想要從事語音的公司,都是找亞馬遜。」麥奎維說道:「每個想要參與語音未來發展的研究生,都是找亞馬遜……亞馬遜在語音上占盡優勢。剩下要看的就是,亞馬遜如何運用這些優勢,以及運用的時機了。」

《聲控未來:引爆購物、搜尋、導航、語音助理的下一波兆元商機》
作者:詹姆士‧弗拉霍斯

譯者:孔令新
出版社:商周出版