李世石人機(jī)大戰(zhàn)已經(jīng)完滿結(jié)束,過去這幾天,AlphaGo以一種猝不及防的方式向世人展示了人工智能鋼鐵般的力量和意志,這場(chǎng)人機(jī)世紀(jì)大對(duì)決的故事似乎要告訴我們,技術(shù)革新已經(jīng)遠(yuǎn)遠(yuǎn)超過了生物進(jìn)化的速度,一旦人類被征服,就再也不可能迎頭趕上。但今天李世石以一場(chǎng)美妙而珍貴的勝局告訴我們,機(jī)器并非沒有缺陷,AlphaGo每秒可以評(píng)估成千上萬種可能的走法,而李世石僅僅憑借一個(gè)人的思考和天賦與之進(jìn)行如此激烈的對(duì)抗,最終在第四場(chǎng)比賽中突破了AlphaGo的極限,這本身就證明了人類無與倫比的適應(yīng)性、靈活性和創(chuàng)造力。
事實(shí)上,按照谷歌DeepMind的聯(lián)合創(chuàng)始人德米斯·哈薩比斯賽前的說法,這也是創(chuàng)造AlphaGo出來的初衷:讓機(jī)器學(xué)會(huì)像人類一樣學(xué)習(xí)。
到目前為止,人類仍然是這個(gè)星球上最擅長(zhǎng)學(xué)習(xí)的物種——李世石可以在四盤棋局里不斷調(diào)整策略,并成功找到AlphaGo的弱點(diǎn),而AlphaGo在此期間卻沒有辦法做任何調(diào)整,因?yàn)闄C(jī)器學(xué)習(xí)需要龐大的數(shù)據(jù)和漫長(zhǎng)的訓(xùn)練時(shí)間,單局棋的經(jīng)驗(yàn)對(duì)它來說毫無意義。很多人以為AlphaGo能從與李世石的對(duì)決中學(xué)到很多東西,其實(shí)幾盤棋根本無法對(duì)AlphaGo產(chǎn)生作用,它至少需要上千個(gè)棋局的數(shù)據(jù)和一個(gè)多月的時(shí)間,才能訓(xùn)練出新的版本出來。
在賽前的全球記者招待會(huì)上,曾經(jīng)有人問德米斯·哈薩比斯:通過這次決戰(zhàn),希望向世人傳遞什么樣的信息?
他回答說:“第一是向世人展示學(xué)習(xí)算法可以多么強(qiáng)大和靈活;第二則是展示人類的智慧,畢竟AlphaGo是一群非常聰明的科學(xué)家創(chuàng)造出來的!
當(dāng)時(shí),沒有多少人在意他的這段貌似外交辭令的回答。但直到賽事發(fā)展到后來,人們才意識(shí)到,李世石的確不是與一個(gè)聰明的機(jī)器作戰(zhàn),而是與機(jī)器背后幾十位天才的工程師作戰(zhàn),這些工程師不僅利用了機(jī)器完美的計(jì)算能力,還以這種計(jì)算能力“量化”了圍棋累積了幾千年的人類智慧。
不知道是否出于客氣,還是本能嗅到了其中的危險(xiǎn)意味,聽完哈薩比斯對(duì)于AlphaGo的介紹之后,李世石第一次收回了自己之前許下5∶0完勝的豪言!叭绻@個(gè)機(jī)器真的有‘直覺’,也許我的勝利不會(huì)是壓倒性的。”這已經(jīng)是這位一向以狂傲著稱的棋手最謙遜的一種姿態(tài)了。
在這場(chǎng)歷史性的人機(jī)對(duì)決中,世人的目光都集中在李世石和AlphaGo身上——一個(gè)是當(dāng)世最偉大的圍棋手,一個(gè)是全世界最好的人工智能專家花了兩年時(shí)間開發(fā)出來的強(qiáng)大的自學(xué)習(xí)系統(tǒng),以至于我們很容易就忽略了也許德米斯·哈薩比斯才是這個(gè)故事背后真正的主角。
德米斯·哈薩比斯,39歲,英國(guó)人,看上去瘦瘦小小,戴一副黑框眼鏡,貌不驚人,履歷卻相當(dāng)驚人——4歲學(xué)國(guó)際象棋,5歲參加全國(guó)比賽,13歲拿到國(guó)際象棋大師的頭銜,16歲考入劍橋大學(xué)攻讀計(jì)算機(jī)專業(yè),17歲開發(fā)價(jià)值數(shù)百萬美元的電子游戲《主題公園》,然后他決定在倫敦大學(xué)攻讀神經(jīng)學(xué)博士學(xué)位,專攻記憶與想象力,35歲創(chuàng)辦人工智能公司DeepMind,去年被谷歌以4億美元收購(gòu)……此外,他還保持著5次獲得智力奧林匹克運(yùn)動(dòng)會(huì)(Mind Sports Olympiad)精英賽Pentamind冠軍的世界紀(jì)錄。
哈薩比斯也曾經(jīng)是國(guó)際象棋神童,4歲學(xué)棋,11歲就已經(jīng)到達(dá)巔峰狀態(tài),卻突然急流勇退。因?yàn)樗X得以國(guó)際象棋為職業(yè),將所有的才華和智慧都傾注在一個(gè)游戲里面,只為了打敗另外一個(gè)人,似乎是一種過于自我放縱的行為!拔蚁,也許國(guó)際象棋只是我的大腦所能做的事情的一個(gè)癥狀,而不是全部。”他這樣說道。
他對(duì)自己的人生有更大的計(jì)劃和野心——他想要攻克人類的“智力”難題。他想創(chuàng)造一種“通用人工智能”(General AI)——一套能夠像生物系統(tǒng)一樣學(xué)習(xí)的靈活、自適應(yīng)的算法,僅使用原始數(shù)據(jù)就能從頭開始掌握任何任務(wù)。在他看來,這是通往人工智能的唯一道路。
在人工智能領(lǐng)域,已經(jīng)很久沒有人提出要制造“人類意義上的智能”了。
但哈薩比斯在建造AlphaGo的時(shí)候,是計(jì)劃它能夠應(yīng)用于解決現(xiàn)實(shí)世界的問題,比如氣候模型或者疾病分析!鞍┌Y、氣候變遷、能源、基因組學(xué)、宏觀經(jīng)濟(jì)學(xué)、金融系統(tǒng)、物理學(xué)等,太多我們想掌握的系統(tǒng)知識(shí)正變得極其復(fù)雜。如此巨大的信息量讓最聰明的人窮其一生也無法完全掌握。那么,我們?nèi)绾尾拍軓娜绱她嫶蟮臄?shù)據(jù)量中篩選出正確的見解呢?而一種通用人工智能思維的方式則是自動(dòng)將非結(jié)構(gòu)化信息轉(zhuǎn)換為可使用知識(shí)的過程。我們所研究的東西可能是針對(duì)任何問題的元解決方法(meta-solution)。”當(dāng)然,現(xiàn)實(shí)世界遠(yuǎn)比棋盤更復(fù)雜,現(xiàn)實(shí)世界沒有絕對(duì)的輸贏,現(xiàn)實(shí)世界的行為常常會(huì)導(dǎo)致意想不到的結(jié)果。
但這是一個(gè)像“阿波羅登月計(jì)劃”一樣野心勃勃的宏圖大志,AlphaGo只是小小的第一步。說到隨機(jī)應(yīng)變、深謀遠(yuǎn)慮,還有什么比圍棋更美妙的試驗(yàn)場(chǎng)呢?
20年前,哈薩比斯在劍橋大學(xué)讀書的時(shí)候第一次接觸到圍棋,立刻就被這種游戲極致的簡(jiǎn)單與復(fù)雜給迷住了。當(dāng)時(shí)卡斯帕羅夫與“深藍(lán)”正戰(zhàn)得如火如荼,他對(duì)他的好朋友、也是后來AlphaGo最重要的設(shè)計(jì)者之一大衛(wèi)·西爾弗(David Silver)說:“如果將來我們也能為圍棋設(shè)計(jì)這么一個(gè)程序那該多好。不過,為了破解圍棋,我們需要一種不光會(huì)計(jì)算的人工智能,因?yàn)閲逄珡?fù)雜,根本不可能總結(jié)出一套規(guī)則可以教給機(jī)器。它得會(huì)學(xué)習(xí),甚至能一定程度模仿人類的直覺!
簡(jiǎn)單地來說,今天的AlphaGo與當(dāng)年的“深藍(lán)”之間最大的區(qū)別就在于,“深藍(lán)”是“教”出來的——IBM的程序員們從國(guó)際象棋大師那里獲得信息、提煉出特定的規(guī)則和領(lǐng)悟,再通過預(yù)編程灌輸給機(jī)器,而AlphaGo是自己“學(xué)”出來的——DeepMind的程序員為它灌輸?shù)氖菍W(xué)習(xí)如何學(xué)習(xí)的能力,隨后它通過自己不斷的訓(xùn)練和研究學(xué)會(huì)圍棋。人類學(xué)圍棋,也是如此。
在電影《模仿游戲》中,人工智能之父阿蘭·圖靈以少年時(shí)代的同性戀人為原型設(shè)計(jì)了他的機(jī)器。事實(shí)上,圖靈當(dāng)年的想法的確是設(shè)計(jì)一個(gè)“像孩子一樣思考”的機(jī)器,而不是成年人,因?yàn)樗J(rèn)為人類智能的秘密是學(xué)習(xí)的能力。
20年后的今天,在AlphaGo贏得對(duì)李世石的第一局比賽后,哈薩比斯在自己的Twitter上這樣寫道:“我們已經(jīng)登陸月球。”