機器勝利?是一群人戰勝了另一個人

鈦媒體

text

【亞太日報訊】麥克·雷蒙不敢相信自己看到的畫面。他的右手在空中足足停留了兩秒,其間四次扭頭看向電腦屏幕上的棋盤,才把一顆黑棋貼在了AlphaGo剛剛走的位置上。

第37手

作為一名職業9段的圍棋高手,雷蒙已經習慣了把自己的情緒隱藏起來。他是這次人機大戰的英文解說嘉賓,一本正經又慢條斯理的解說風格,有時會讓人犯困。不過一秒前他臉上的困惑以及隨後的嘴角上揚,都說明了賽場上發生了一件不同尋常的事,而這一切,剛好被掃過的特寫鏡頭逮到。

因為現場轉播信號的延遲,古力比雷蒙晚了一分多鐘才看到這一手棋。他的反應與雷蒙如出一轍,只不過更加激烈,“AlphaGo怎麼會下這裡?” 整個騰訊的直播間也因這一步棋炸開了鍋,國家圍棋隊總教練俞斌表示“反常規”,職業棋手唐奕覺得“是業余水准”,沒有人覺得這是一步“對”的棋。

李世石抽完本場比賽的第一支煙,回到座位上。他也看到了對手的這一步棋,第一次露出了疑惑的神情。不過這種疑惑持續了只很短的時間,隨後,他陷入了長時間的思考,臉色也變得越來越難看。“印像中我從沒見過職業高手下這樣的棋,李世石可能也沒有,所以看得出,他要好好考慮一下。”雷蒙評論道。

這一幕發生在“人機大戰”第二場比賽開始後50分鐘,AphaGo所下的第37手。

根據比賽的規則,每名選手都有兩個小時的常規時間,再此期間選手可以任意分配每一步棋的時間(10秒或者10分鐘)一旦時間用完,就要進入“讀秒”,每步棋考慮時間不能超過60秒。

李世石明白,第一場的失利很大程度上是因為自己下得太快,考慮不周全。在投子認輸時,他還有近半小時的常規時間,比AphlaGo少用了25分鐘。因此在第二場比賽中,他有意放慢了每一步棋的節奏,希望可以考慮得更周全。在這一步棋之前,他的總用時是25分2秒,比AlphaGo多用的5分鐘幫他換回了盤面上的一點優勢,於是他放松地起身,去抽了第一支煙。

AlphaGo無法感受到李世石心情的變化,所以這一步“怪棋”也不像只是簡單地想把當前的局面攪亂,而是跟前面的36步一樣,進行過分析後的決定。李世石明白這一點,也正是因為如此,他花了更多時間去思考這棋背後的“深意”。

“當你覺得它足夠厲害時,即使它真的下了一招爛棋,你也會覺得它有別的什麼意圖,只是自己沒有看出來。然後你會越來越懷疑自己。”在回顧0比5輸給AlphaGo的心理變化時,樊麾說道。

在賽後接受采訪時,作為裁判的他對AlphaGo的這一步棋贊不絕口。在此之前,他曾經說過“AplhaGo缺點是他無法理解圍棋之美”,但在這一刻, AlphaGo卻用自己的一步棋讓他體會到了其中的美和優雅。

麥克•雷蒙也感受到了這種“刺激”,他說經過這兩天的觀察,自己非常想和AlphaGo下一盤棋。“許多圍棋高手都會有自己習慣的套路,尤其是在布局階段。這樣做確卻更加穩健,但是下多了也少了許多變化的樂趣。”雷蒙說,“而這也是AlphaGo與眾不同的地方。”

15分37秒,這是李世石在這一步棋上花掉的思考時間。從結果上看,這一部棋並沒有對之後的棋局產生巨大的影響。但在下完這步棋後,他的用時已經比AlphaGo多了20分鐘。有意思的是,李世石比AlphaGo先讀秒的時間,也恰好是20分鐘。

“今天AlphaGo的表現幾乎是完美的,自始至終沒有一步棋讓我覺得它下得不合理。我無話可說。”李世石在第二場比賽後的新聞發布會上說。

誰是李世石?

第二場比賽多花了一個小時,但從比賽結束到召開發布會的進間,卻縮短了十幾分鐘。

與第一場結束後的熱烈討論相比,現場的氣氛更加壓抑。李世石入場沒有像昨天第一場失利後那麼緊張和不安,但卻多了些落寞。一位韓國媒體鼓起了掌,想給李世石打氣,但單薄的掌聲顯得異常刺耳。

第一場之後,仍然有不少韓國媒體在為李世石的失利尋找理由,比如下得太快,失誤太多,比如有些輕敵,不太認真。這些理由的背後傳統的共同信息是,只要李世石認真下,仍然可以取勝。

而在24小時之後,當目睹了AlphaGo是如何從開始到結束掌控主局面,沒有給李世石任何獲得的機會,最終又逼迫李世石投子認輸後,大家心裡對於誰強誰弱,已經有了一個答案。而作為韓國媒體,需要用更多進間去接受這種現實。

在韓國,李世石並不是一個招媒體喜歡的棋手。

“目中無人”、“口無遮攔”、“不尊重對手和前輩”,你可以在任何一個韓國圍棋記者口中得到這些形容李世石的話。在過去15年,這些標簽就像他的成績一樣耀眼,即使他現在已經比過去收斂許多,這些輕狂之言也時常會被翻出,雖然大部分時間僅僅是作為談資。

比如在2001年第5屆LG杯決賽中輸給前輩李昌鎬之後,年僅18歲的李世石卻說“在所有高手中,昌鎬的水平是最差的”,同樣在兩年後的LG杯中,李世石再一次語出驚人,他說自己心目中世界冠軍的候選中,沒有包括馬曉春。在對尊卑位份異常重視的韓國,李世石常常因此受到媒體詬病。

他還經常在大賽前做出樂觀的預測,2005年1月第二屆豐田杯,李世石與常昊冠亞軍決賽前,他聲稱自己“有65%至70%的勝算”,盡管當時雙方歷史交手的成績是1比4;2010年第12屆農心杯前,李世石面對10位中日高手,聲稱要取得“十連勝”。

即便在這兩年有所收斂,但是在接受Google AlphaGo的圍棋挑戰時,李世石仍然在第一時間表示,比賽將會是他以5:0取勝。

這一次,李世石不僅是代表韓國,而且是代表人類出戰。這個巨大的噱頭無疑刺激到了韓國媒體們的神經,只要他能贏,他說什麼都行。

一時間,李世石以一種“民族英雄”的形像登上了報紙和電視的頭版頭條,所有的報道都在極力渲染這次比賽的重大意義,“從沒有見過這麼多媒體如此關心一個圍棋選手和圍棋比賽”,一位跑了15年圍棋的韓國記者表示。

這種關心的“保質期”並沒有想像得那麼久,比賽當天那種300多家媒體湧進四季酒店,為了提前進場占據一個有力位置不惜提前一個小時排隊的盛況已經不再。來到現場的韓國媒體數量大概只有前一天的70%,中餐自助午餐的消耗速度也不像第一天那麼快。

3月8日上午的賽前新聞發布會,當Google DeepMind公司CEO Demis Hassabis在台上講解AlphaGo的算法原理時,一大群攝影師衝到了場地前方正中央,拍攝坐在前排的李世石,擋在了Hemis和其它台下的記者之間,甚至引起了部分國際記者的吐槽。

而在3月9日第一場的賽後發布會後,位於舞台右側角度裡的DeepMind團隊被長槍短炮團團圍住,閃光燈閃個不停。到了3月10日第二場比賽之後,你會看到這些穿著統一黑T恤的外國人時常會被韓國記者攔下,用不太流利的英語問著關於AlphaGo,關於Google的一些問題。

李世石不再是鏡頭的全部。越來越多的媒體想知道,這個兩次戰勝了李世石的AlphaGo,到底是個什麼玩意?

一支叫AlphaGo的小分隊

一群穿著統一黑色T恤的年輕人,突然聚集在了國際媒體直播間門口。他們在相互擊掌、擁抱,臉上的笑容,就像是在聖誕節早晨得到了心儀禮物的孩子。

這是3月9日下午3點30分左右,就在幾分鐘之前,李世石出人意料地做出了投子認輸的決定,這也就意味著AlphaGo第一次擊敗了職業9段圍棋手。媒體們一齊擁向了十幾米外的長廊兩側,這裡是李世石從比賽現場走到發布會房間的必經之路。

其中一個年輕人為了躲開一個從身邊匆忙跑過試圖擠進長廊兩側的媒體,往後退了一步。他對身邊的另一個戴眼鏡的哥們兒聳了聳肩,露出了一副“看我們干的好事”的神情。這時候,英文解說嘉賓Chris Garlock從媒體直播間走了出來。“太棒了,實在是太棒了。恭喜你們。”Garlock對這種小伙子說。在說這句話時,他似乎還沒有從剛剛的興奮中緩過來,當李世石投子認輸時,他一連喊了三個“wow”。

黑色T恤背上的AlphaGo字樣暴露了這群人的身份,他們正是來自DeepMind公司,開發了AlphaGo的那群人。就在幾分鐘之前,他們創造了歷史。

這是一支15人的小分隊,為了這次比賽特地從倫敦飛到韓國,從2月底開始,就住在四季酒店,為比賽做著各項准備。

George Van Den Driessche 和 Julian Schrittweiser 是兩位最主要的工程師,他們的主要任務,就是保證AlphaGo能在這裡順利運行。“他們許多與系統相關的檢查,包括查看各個接口,准備備用方案。”DeepMind的創始人,CEO Demis Hassabis說道。

除了工程師,這個團隊中還有人專門負責IT基礎設施。盡管韓國是全球網速第一的國家,但團隊仍然在酒店鋪設了特別的網線,保證全球直播過程中的高速和穩定。

另一部分團隊成員則與Google的團隊一起,負責比賽的組織。不同顏色的號碼牌代表不同的權限,每一個區域交接處都有至少兩名安保人員站崗;直播間為國際媒體和DeepMind團隊專門預留座位,所有發布會和采訪時間的誤差均不超過10分鐘。

“我從來沒有見過組織比賽這麼細致的,所有的事情都要排練好多次。”樊麾感歎道。作為這次比賽的裁判,他從比賽前5天就來到了首爾,幫助小分隊一起准備。

第一場比賽的賽後發布會上,AlphaGo項目的主要負責人David Silver和公司CEO Demis Hassabis、李世石一起上台接受的采訪。而在離他幾米遠的地方,小分隊的成員們聊得正high。發布會一結束,這個角落就被媒體團團圍住。他們終於成了主角。

這不是機器的勝利,而是一群人戰勝了另一個人。而這群人正在制造“未來”。未來,正在發生。