趨勢科技董事長張明正:AlphaGo Zero讓人類看到自身盲點,企業應更謙卑


從2016年AlphaGo打敗人類棋士後,「人工智慧」(AI)一詞彷彿成了企業對外行銷利器。企業推出產品或宣布未來布局策略,一定得跟AI掛勾,就連政府機構在審核補助計畫時,這個詞彙也彷彿成了通關密語。

其實,在AlphaGo吸引眾人目光前,台灣本土軟體業者趨勢科技內部也一直都有類似的圍棋程式計畫,而2017年4月,趨勢科技也與國研院合作打造機器學習交流平台T-Brain,期望打造台灣版的Google Kaggle。

張明正認為,AlphaGo Zero反映人類在經驗和知識領域上都存在盲點,未來企業必須更謙卑、不斷學習,並拋開既存的各種框架。

DIGITIMES專程赴花蓮,獨家專訪趨勢科技創辦人暨董事長張明正。這位早已從自己一手創立的公司中退位超過10年,現在隱居於花蓮海邊的台灣本土科技老將,在採訪過程中數次以「我的媽呀!」表達他對AlphaGo Zero技術進展的讚嘆之情。

趨勢科技董事長張明正:AlphaGo Zero讓人類看到自身盲點,企業應更謙卑
趨勢科技董事長張明正:AlphaGo Zero讓人類看到 自身盲點,企業應更謙卑

欽佩之餘,他也不諱言目前有危機感,更直言若AlphaGo Zero發展到極致,諸如趨勢科技這類過去掌握大量數據的中大型企業,將不再具有優勢,企業必須居安思危。

他反覆講著,「人類知識有太多盲點了。」張明正彷彿也在努力跳脫自己的盲點和框架,包括過去習得的技術、市場競爭等經驗,嘗試從科技哲學角度,給予產業一個不同的思考路徑。

對於企業未來該怎麼應對AI的終極發展,他沒有給出一個明確的答案,但這個不明確的答案,恰好正呼應他不斷提及的人類知識盲點。因為,之所以會問出這樣的問題,大概就是因為人類世界的盲點吧。以下為DIGITIMES專訪趨勢科技創辦人暨董事長張明正的全文內容。

問:您認為AI在1.0、2.0、3.0和4.0時代,分別有何特色呢?對產業又有何意義?

答:早在Google推出AlphaGo之前,趨勢科技內部也有一個與旅日職業棋士王銘琬合作的電腦圍棋的AI計畫Go Trend,當時用的是AI 1.0時代的技術,諸如蒙地卡羅(Monte Carlo)等方法,也從2015年開始參與電腦圍棋競賽,首次參賽就拿下第六名。

2016年再度參賽時,原本希望拚進冠亞軍,但AlphaGo推出後,和當時的高手對弈連贏好幾盤,我們雖然覺得往後已經不需再參賽了,但並沒有失去興趣,反而更加關注AlphaGo。

AlphaGo屬於AI 2.0時代,是透過輸入約3,000萬盤圍棋棋譜,讓他一直玩、一直自我學習,但這些棋譜程度不一,同時包含二段到六段等級的棋譜,卻可以打敗九段的真人高手,甚至後來還贏了大陸職業棋手柯潔,以及南韓職業棋手李世石。

對我這個學習電腦科學的人來講,震撼點在於,一個機器竟然可以透過輸入二、三段或六段等較低階的棋譜後,自己不斷玩、不斷進行深度學習,最後打敗擁有高段實力的棋手。因為深度學習本來是需要龐大的資料,但AlphaGo卻能以那樣的方式進行深度學習,並擊敗真人棋手,這對我而言非常震撼。

因此,當進入AI 2.0時代後,我們不再外出比賽,而是找來一群圍棋高手,由王銘琬棋士帶頭,在公司內部討論切磋。

繼AlphaGo後,又推出升級版AlphaGo Master。舊有的版本其CPU需要176個GPU,但Master版本則用到Google自己的4個Tensor Processing Unit(TPU),能以更少的棋譜去進行深度學習,讓AI進入3.0時

代。

而在2017年10月初,隨著AlphaGo Zero問世,我認為已經進入AI 4.0時代。在AlphaGo Zero出現前,談到AI,我們都認為是大數據(Big Data)加上深度學習;但AlphaGo Zero不需要任何棋譜,即可在圍棋比賽中擊敗前幾個版本,這不僅大大改變我的看法,也對趨勢科技有非常重要的意義。

趨勢科技長期以來核心業務即是找出電腦世界的壞蛋,但不要誤抓好人。這中間需要強大的預測能力和概率能力,其中也包含一些人類經驗的成分,這個過程就像是將規則做成棋譜,再丟給機器協助處理。

前陣子的勒索軟體肆虐事件,我們之所以能夠抓到壞蛋,是基於將近30年累積的資料庫,包括病毒碼、電腦侵入威脅的資料等,據此以演算法再加上AI輔助,協助抓出駭客。

然而,在我看到AlphaGo Zero出現後,我認真思索,若它的技術未來能夠成功應用到防毒軟體領域,那我們的優勢可能就會消失了。這種衝擊就像是以前照相需要底片,但出現數位相機後,未來不再需要底片,卻可以照更多的相片,這對相關產業的衝擊將會很大。

以前的工程師還可以宣稱,自己是大數據工程師,但如果未來不再需要大數據呢?此時大數據工程師的優勢何在?

AI發展至今,我認為有4個階段。最初的1.0時代是演算法,2.0時代是大數據,數據的多寡決定你的表現;3.0時代雖然仍然需要數據,但即使只有少量數據,只要再加上他人訓練過後的資料,仍然可以有
好表現。

而AlphaGo Zero讓AI在短短的1年半之間,從2.0時代快速跳到4.0時代,一個不需要任何數據的時代。它並不單純只是一個更厲害的新版本AI,我認為它將改變所有的事情,影響力更勝以往。

回到趨勢科技,我們許多產品還停留在2.0和3.0時代,但我們也警惕自己,倘若未來不再需要數據,我們的優勢何在?而哪些領域仍需要數據,哪些領域又不需要數據呢?

問:AlphaGo Zero的科技哲學意義為何呢?過去AI在人類世界中,因為需要大量數據,可能只有企業或工廠才能廣泛應用;相較之下,在個人用情境裡,或許因為缺乏數據,至今沒有較好的應用。AlphaGo Zero問世後,未來會有怎樣的想像世界呢?

答:AlphaGo Zero讓我開始從哲學性的脈絡,重新思考現在的世界。我們過去獲取知識的管道,例如上學、讀書、向前輩學習經驗等,這些其實都只是知識來源的極小部分而已。

過去我們認為的知識,是來自「我知道我所知道的」(I know what I know),例如我創辦趨勢科技,是因為我知道如何抓病毒;我以前不知道怎麼種菜,是因為我沒當過農夫,但隨著我開始嘗試栽種,我就獲得了種菜的知識。

但現在發覺到,「我不知道我所不知道」的領域知識,竟然佔了我頭腦知識的絕大部分。人類下了超過2,000年的圍棋,人類棋手一步一步走到九段地位,獲得本因坊頭銜,屬於高手中的高手,但後來被透過學習兩段、三段棋譜的AlphaGo擊敗。

而AlphaGo Master雖然可以學習少量的棋譜進行深度學習,但仍然會下一個人類棋手經驗中被視為壞步的棋,代表人類經驗世界存在盲點,甚至可能有超過9成都是盲點。

相較之下,完全沒有棋譜的AlphaGo Zero,雖然剛開始都亂下棋,也不像AlphaGo Master一樣,可以很快就追上,但AlphaGo Zero在經過幾次隨意下棋後,最後迎頭趕上甚至超越。

棋譜代表人類的領域知識,是一種框架;而沒有輸入任何人類領域知識的AlphaGo Zero,跳脫了人類世界的許多假設和盲點,卻能表現得更好,這是一件非常有趣的議題。

於是我開始思考,AlphaGo Zero不需要人類的領域知識,代表人類的盲點會卡住它、讓它綁手綁腳,那人類的盲點有多大呢?是1%還是99%?

AlphaGo是輸入約3,000萬盤棋譜,跟自己玩了差不多2,000萬盤棋,而AlphaGo Zero用更低的消耗電、更少的CPU,只玩了約500萬盤棋,就打贏所有擁有人類數據的圍棋程式。先來計算一下,500萬約是10的9次方,而圍棋的所有可能性約是10的360次方,那麼,10的9次方對整個圍棋可能性10的360次方的佔比,大概是多少呢?

這代表一件事,AlphaGo Zero只用了圍棋所有可能性的極小部分,就擊敗舊版圍棋程式,大概就像是人類拿了大英百科辭典,只看第一頁的2個字,就理解整本書的意義,這也是為何我不斷提到人類的知識盲點。

在人類現有世界裡,存在許多待解決的議題,例如能源稀缺,而過去我們嘗試從太陽能、風力、海流等方式獲取能源,但至今仍舊無法真正解決能源問題;或許這些問題至今無法找到解答,就是因為我們受限於盲點和框架,僅以人類的方法去解決問題。

從終極角度思考,倘若AlphaGo Zero能解決這些問題,讓能源變成免費,海水變成淡水,因為土地都可以種植了,食物也就免費了;因為汽油免費了,所以運輸也免費了。

當一切物資都免費了,未來的人類世界可能就不需要金錢。或許現在聽來異想天開,但未來一切都說不準。15年前撥打電話,是按照時間、距離計算;但現在OTT興起,即使使用Facebook Messenger撥打網路語音給國外的友人,也不再需要額外收費,Facebook的市值也超越了傳統電信公司AT&T。

這樣的變化,就是因為Facebook Messenger讓撥打電話的時間或距離不再重要,過去用以衡量價值計算的單位因而轉變了;而同一時間,人和人之間的分享、互動、聯繫變得更重要,打造出現今的Facebook盛世。廣告、行銷也因此變得愈來愈重要,這也是為何今天的Google超越T-Mobile等跨國電信公司。

這些變化都在短短十幾年內發生,而這個不再需要數據的AI,也會為世界帶來重大影響。AlphaGo Zero傳達了一件事,原有的人類知識或科技解決方案,也可能都限制了人類的潛在能力,而這些限制可能來自於既有教育、社會以及家庭的制約。

這些是人類過去獲取知識的方法,但未來若人類覺醒,跳脫傳統獲取知識的管道,未來企業競爭型態也可能會有很大的轉變。

問:既有企業未來的競爭優勢為何呢?AlphaGoZero對趨勢科技有什麼樣的意義和啟示?

答:很多企業可能認為自己擁有很多數據,覺得自己很厲害,但其實我們的盲點太多,許多我們認為的假設可能都要一掃而空,才能應對未來的世界變化。就像前述提及的語音通話例子,過去以距離和時間算錢,現在不再需要這些單位後,有些企業崛起了,但也有些企業日薄西山了。

若在AlphaGo Zero問世前,我可能會覺得趨勢科技在發展AI應用上,需要大量數據,再加上人類的領域知識。以醫療領域為例,過去可能認為需要數據和醫生的知識,然後進行「模擬」,而模擬這兩個字,其實就顯現我們已經被制約了,是在一個既有知識架構下去模擬,而那些數據其實也是人類的數據、人造的數據。

而過去在判斷AI做得好不好,我們當時的定義可能也是數據量多不多?領域知識好不好?但未來,我希望員工開始可以進行反省,思考過去抓病毒的方式,在未來該如何進化;而隨著我們進化,駭客也一定會跟著進化,這將是免不了的一場戰爭。

我關心的是,未來會不會有一個成員僅有1~2人的新創團隊,用AlphaGo Zero的方式寫了一個防駭客病毒的產品,就超越我們?以前我不相信未來會出現這樣的產品,因為過去需要以數據做為基礎,但未來已經不一定了,這與競爭對手是否關注AlphaGo Zero無關,這攸關企業生存,未來的變化很迅速,一切都不確定,需要居安思危。

AI的演變,與產業市場的關係,可以大略分成3段式。第一階段是AI演算時代,不需要太多數據,只要有1個AI模型(model)再加上領域知識,就能與大企業齊名。

第二個階段是AI 2.0,出現深度學習後,當我擁有數據而你缺乏數據,我的效能就會大幅提升。在這個階段,包括Facebook、Google等掌握大量數據的企業,其優勢都很明顯。

第三個階段,則是不需要數據的AI 4.0,所有市場將重新洗牌,小公司就有機會了。

我們是屬於擁有數據的公司,但我們仍要居安思危,一旦進入第三階段,若有新創團隊不需要任何數據,就可以抓到所有的病毒和駭客,從使用者角度來講,這個新創團隊就可能贏了。不過,是否AI以後都會不需要數據?若真的不需要,那數據科學不就滅亡?人類的領域知識真的與未來發展沒關係嗎?因此,我們開始將問題進一步思考,為何圍棋會符合上述的定義。

圍棋勝負分明、規則簡單明瞭,但病毒並不是只有一種,有的來自電子郵件、有的來自網站,複雜性較高。若一個企業推出的解決方案所需要的知識,是由5~6個領域疊加起來,或中間有5~6個變因參與其中,而非像圍棋一樣輸贏結果簡單明瞭,AlphaGo Zero就較難準確預測,因此企業仍舊可以
保有既有優勢。

Google的DeepMind團隊曾經在未輸入任何規則的情況下,讓AlphaGo Zero玩以前的電玩遊戲,2天以後AlphaGo Zero同樣也打贏所有參與者,但那些電玩都屬於可輕易論斷輸贏的情境。

現在AlphaGo Zero則開始挑戰策略性電玩遊戲,這類遊戲含有各種變因,不同決策會帶來不同結果,整體較為複雜,因為AlphaGo Zero不擅長解決這類問題,因此目前還是落敗階段。雖然現階段對它而言依舊有門檻,但不代表未來它不會學好。

我希望趨勢科技公司的每個人,都能在「AI不需要數據」以及「AI已經進入4.0」等大前提下,思考我們的客戶有更好的保障,因為我們存在的目的,就是不讓客戶被更厲害的駭客打倒。

AlphaGo Zero對趨勢科技帶來2個意義,一個是對公司文化層面,另一個是商業競爭層面。

第一個意義,從公司文化來講,我們過去一直談改變,但現在改變將比想像中來得更快。趨勢科技的存在意義,就是讓客戶知道他們被保護,也可以提前預警他們下一次攻擊可能是什麼時候來,這件事情是我們的核心業務,維持不變;但其他事情,例如來自物聯網(IoT)、雲端等的科技變化,我們每個人都要更快速因應變化,也不要限制自己,不要認為病毒或駭客一定是從怎樣的模式進來,需要拿掉頭腦既存的各種假設。

我們不能自傲於以前的成功,必須以AlphaGo Zero的拋開盲點為師,特別對工程師而言。

另一個意義,從商業角度看,由於我們比競爭者更早思考這件事,我們也有將近1,000名AI高手,這是我們的優勢。目前我們的要求就是,若產品未來沒有AI,那就別談了,因此在技術角度方面,這將會帶領我們往愈來愈強的方向前進。

問:未來人類的角色是什麼?與AI之間的關係又會如何?

答:當AlphaGo Zero不再需要人類領域知識時,未來人類的角色是什麼呢?很多人都討論過類似議
題。

有些人認為,未來娛樂時間變多,因此人類將負責娛樂;但我覺得這樣的推測或討論,都還是限於人類擁有領域知識、且只有一小撮人可以賺大錢的前提之下,倘若連人類的領域知識都不需要的話,可能連這個都不用討論了。

2016年後,我們的圍棋團隊一度解散,但直到2017年8月,我們又重啟計畫,因為王銘琬棋士認為,應該要重思下圍棋的目的。

我們過去參加比賽,是為了爭輸贏,但王銘琬認為,下棋的目的是讓人類進行情感的溝通,因為在那一個時間點裡,「我」在那裡,而我下個棋雖然被機器打敗,但我仍有我的棋風,就像職業棋士內就分成各種流派。

如果人類下圍棋的目的僅是為了輸贏,那當AlphaGo打敗人類棋士後,難道就不會有人再下圍棋了嗎?事實上,下圍棋的人數並沒有什麼變化,因為人類和人類的互動是感性的結合,而非理性的結合。

我們後來認知到,AI並不會存在太多的「意義」,而人類生命有限,再加上若被滿足基本生存需求後,人類就會往上尋找其他心理層面的需求,這就是在尋找意義。或許當AI往上爬後,也開始發展意識,並尋找意義,但這又是另一個議題了。

因此,我們後來重啟圍棋計畫,嘗試以AI和別人對弈,協助人類學習圍棋。若你是初學者,那只要下個兩三步,機器就知道你屬於哪個等級,並自動調配成類似的程度,讓你覺得下棋有趣,對弈結束後也可以依據歷史棋步,向人類玩家解析各種可能的走法。

無論未來人類與AI的關係怎麼走,我們都要承認,人類都有盲點。我們不知道的事情太多了,應該要更謙卑,要不斷學習;當技術演變得愈來愈快,企業也要走得更快,把自己既有的那些理所當然的觀念都打破,不要被框架限制住人類的潛力。

原文出處:DIGITIMES電子時報 作者:翁佩嫆