人機大戰最後一戰:李世石能否再造“神之一手”

亞太日報

text

【亞太日報訊】3月15日,世界圍棋冠軍李世石與谷歌(微博)AlphaGo的世紀人機大戰進入到最後一場。而這已經是一場無關最終勝負的較量。

李世石與AlphaGo的較量已無法再現之前幾場的驚嘆:當人類認為AlphaGo不可能這麼快就戰勝人類頂尖棋手時,結局是3:0;當人類認為AlphaGo高維打低維,輕松碾壓人類時,李世石扳回一局1:3。

當然,今天依然是一場值得期待的比賽。原因在於,李世石已在AlphaGo執黑時,發現了AlphaGo一個缺陷。那麼,李世石能否在自己執黑時,再次發現AlphaGo的缺陷,再造“神之一手”?

圍棋六段李喆說,今天已沒人從心裡質疑圍棋AI技術層級在人類之上,但人們需要這樣一場勝利來提振信心。“期待第五局!這五局棋譜,紀錄著人與AI歷史性對話,將流傳千古。”

不平等的對抗:李世石初期對AlphaGo知之甚少

這場李世石與AlphaGo的對抗從一開始就不是平等的。盡管谷歌強調AlphaGo並非是針對李世石來進行訓練,但AlphaGo已進行了幾百萬、上億的棋局培訓,還進行自我的學習。

早在賽前AlphaGo開發領導人哈薩比斯就強調AlphaGo與Zen、Crazystone這些圍棋程序最大不同是其不是“死算”,而是“有選擇性搜索”和選擇,AlphaGo不會輸給李世石。

雖然AlphaGo曾與歐洲世界冠軍樊麾比賽,但由於AlphaGo擁有很強的學習能力,在這場比賽進行了5個月後,之前AlphaGo與樊麾較量的數據已經失去了參考意義。

李世石與AlphaGo經歷了這4場比賽,其內心也發生了過山車一樣的變化。

李世石在賽前表示,AlphaGo與樊麾的比賽過去五個月,不知AlphaGo又進步了多少。“我了解了它的原理後發現,雖然我很少犯錯,但若我犯了一個小錯誤,就可能真的會輸。”

這意味著李世石賽前對AlphaGo一無所知,AlphaGo卻了解李世石。李世石面臨“敵在暗處”,己在明處的不利局面。

在連敗三場後,李世石接受采訪時表示,“第一場我下得不好,第二場我開局不錯,但中間錯過不少機會;第三場比賽,我覺得壓力太大了,我從來沒有在比賽中感受過這麼大的壓力。”

李世石的對手、世界圍棋冠軍柯潔點評說,李世石求戰的心理非常強烈,開始就下出了非常激烈的棋,但之後輕松被電腦瓦解之後,形成了非常不利的局面。

柯潔說,“李世石的布局可以說比前兩盤還要失敗,之後一直被電腦壓制,所以說李世石今天是比前兩盤更加脆、更加徹底的失利。”

而當所有人都認為AlphaGo與李世石的“人機大戰”已沒有看點時,李世石帶來一份驚喜。北京時間3月13日下午4點44分,AlphaGo第一次舉起了白旗。

當李世石走進發布會下場時,現場掌聲和尖叫持續一分鐘。開始還崩著臉了李世石忍不住笑了。李世石跟媒體開玩笑說,“我從來沒有因為贏了一場比賽,得到這麼多的掌聲和祝賀。”

李世石說,“因為我前面已經輸了3場,所以我的壓力沒有這麼大。這場勝利對我來說很重要,但如果沒有大家在後面支持我,我今天也贏不了。”

李世石在幾場的比賽中不斷進行試探,熟悉AlphaGo,最終才找到破解之策,但大比分已落後,最終李世石還是輸掉了這場與AlphaGo的人機世紀大戰比賽。

孤獨衛道者:一人戰勝1200余個CPU

盡管是代表“全人類”征戰,李世石卻是孤獨的,他是一個大腦面對1200余個CPU的挑戰。

在李世石連續輸掉兩場比賽,大家都不看好的時候,圍棋六段李喆點評說:李世石面對AlphaGo,並未因五個月之前的棋譜而有絲毫輕視,他做了非常充分的准備。他拋開人類的偏見和自負,試圖理解AlphaGo運算的機理,並找出其中可能存在的弱點。

在比賽伊始,李世石就對AlphaGo可能存在的弱點進行了直指要害的攻擊,並且在失敗後迅速調整,繼而展開了第二次、第三次針對性攻擊。正是他的策略針對性,使人們更好地理解了AlphaGo的強度和特點,以及不同於人類的決策模式。

李世石在第二局中就已經找到了足以在中盤接近甚至抗衡AlphaGo的布局策略,使人類第一次見識到AlphaGo夢幻般的後半盤。

李喆說,“從這兩盤來看,我不認為世界上還有哪一個人能夠代替李世石將這件事做得更好。”

而在搜狗CEO王小川表示:“AlphaGo已經表現出十二段的水准,而我們還在遮羞‘逆轉’、‘失誤’以及‘嘲笑’,這就是被吊打而不自知”時,李世石卻贏得一場讓人意外的勝利。

圍棋六段李喆在這場賽後表示,李世石的不懈努力終於得到了勝負層面的回報!第四局就找到了阿喀琉斯之踵,他在前三盤的探索相信會得到更多人的理解。

韓國媒體則在被壓抑太久後喊出,李世石守住了人類最後的自尊心。“一個人類大腦終於戰勝了1200余個CPU”,“人工智能的主人最終還是人類”。

未來人類在圍棋領域將無戰勝機器可能

在李世石與AlphaGo的第四場比賽之中,長達近3個小時,李世石一直被AlphaGo壓制。

但形勢在下午2點42分出現逆轉,李世石第78手下出妙手,被圍棋九段古力稱為“神之一手”、“前四盤棋中最漂亮的一手”,而AlphaGo的應對則被古力稱為“有誤算”。

這一步讓AlphaGo突然抽瘋:黑87直接跳出死子,令負責為電腦擺棋的研發者黃士傑業余6段也露出詫異表情;黑93繼續送吃,連平素冷酷的李世石看後都露出了詫異地笑。

有媒體稱,“最不可思議的是黑97,直接送吃黑子,韓國前方的研究室裡爆發出哄笑聲,人類此刻終於明白了,阿爾法圍棋紊亂了!電腦程序異常了!”

最終讓李世石贏得這場比賽。針對這場比賽結果,AlphaGo創始人哈薩比斯說,AlphaGo通過計算勝利的可能性選擇有哪一手,如果勝利可能性低於閾值就認輸,它會告訴操作員。

哈薩比斯說,李世石給AlphaGo帶來很大的壓力,所以說最後AlphaGo沒有表現好。“李世石先生的確推動了AlphaGo展現了自己的缺點,對於我們來講這是非常有價值的。”

現場解說嘉賓、圍棋九段麥克雷蒙表示“在比賽的中間部分,就是78手下李世石下的非常好,我有點驚訝。我想多數的對手都會感到驚訝,特別是AlphaGo也感到驚訝。”

這場比賽後,李世石難掩興奮,稱“希望第五場執黑贏比賽,因為執黑可能會贏的更有意義。”

不過,即便李世石贏得第五場勝利,依然無法改變一個殘酷現實,那就是AlphaGo的圍棋技術層級已經在人類之上,假以時日,人類在最復雜的圍棋競技領域將再無可能戰勝AI。

但這場比賽也有積極意義。搜狗CEO王小川說,這是一種啟蒙運動,能增強大家對人工智能的理解。會使工程師、技術人員更有信心,建立更大信仰推動人工智能技術的發展。

王小川說,將來消費者也會更願意接受這種機器帶來的服務。“比如,以前我們講機器可以給人看病嗎?機器可以當老師嗎?機器可以幫你炒菜嗎?這種問題的突破就會接踵而來。”