人機大戰:這一次,為什么大咖們猜錯了

新華社

text

【亞太日報訊】(新華社記者劉石磊)“除了以5:0戰勝它以外,其他都沒有意義。”

李世石在賽前的記者會上

這是“人機大戰”前,李世石對韓國媒體發表的“宣言”。自信滿滿的不只李世石一人,許多圍棋高手、甚至計算機專家,都看好人類棋手取勝。然而,“阿爾法圍棋”連中三元,絲毫不講“情面”。

不看好計算機,首先源於對圍棋這一“人類智慧高地”的信心。這種源自中國的古老遊戲難度之高毋庸置疑:361個交叉點可讓棋盤上變幻無窮,千古不同局。計算機難以“故技重施”,用擊敗卡斯帕羅夫和中國象棋大師的“窮舉”法取勝。

也正因如此,計算機在“稱霸”國際象棋和中國象棋後,始終難以在圍棋上佔到便宜。即使在去年10月戰勝歐洲冠軍樊麾後,“阿爾法圍棋”也沒能得到多少高手的“正視”——他們認為樊麾遠非頂級水準。

圍棋專家畢竟不是計算機專家。他們信賴10年內獲冠軍頭啣最多的人,不認為“初出茅廬”的一款軟件能有什么過人之處。況且與樊麾一戰,“阿爾法圍棋”確實只有“業餘頂級水準”。

但是,“阿爾法圍棋”與“深藍”等前輩最大的不同,恰恰在於學習能力和算法的優化。

《自然》雜誌

按照“阿爾法圍棋”開發團隊在英國《自然》雜誌發表的論文,其技術架構模倣人類大腦神經模式,會分析人類棋手的不同策略,然後自己“苦練”下棋並從中學習提高。

並且,“阿爾法圍棋”不以計算速度,而以優化的算法取勝。它會先評估棋盤上各個位置的“價值”,再選擇在哪落子。這可以幫助它減少大量無用計算,更智能高效。與“深藍”相比,“阿爾法圍棋”所評估的棋子位置只有數千分之一。

學習能力意味著棋力可不斷提高,優化算法意味著智能程度更接近人類棋手。這兩點相加,使得“阿爾法圍棋”的真實水準,在3月9日落子之前,無人可知。

是的,就拿學習能力來說,不要說圍棋專家難以理解,即使人工智能專家,也很難確切地知道。正如美國臉書公司人工智能項目負責人田淵棟所說,這種能力是其開發者事先也估計不到的,“只有試了才知道,人工智能研究就是這樣”。

從科研角度講,眾多大咖猜錯對弈結局,說明人工智能技術的進步驚人。許多專家此前認為,計算機戰勝圍棋職業棋手,至少還要10年。“阿爾法圍棋”的勝局顯示出,這一領域的技術發展已經超出預期。