赢了“人機大戰”后 AlphaGo下一步要挑戰游戲領域

亞太日報

text

【亞太日報綜合報道】AlphaGo再贏一局。在韓國首爾鐘路區四季酒店裡舉辦的“人機圍棋大戰”已經引起了各界關注。3月10日,代表谷歌人工智能程序AlphaGo首戰告捷,今天又再下一城,人工智能的發展速度令人震驚。

人機大戰采取五局三勝制,如果下一賽場AlphaGo再度獲勝的話,機器將在圍棋領域戰勝人類。在3月10日的第二場比賽中,AlphaGo不斷下出罕見變招,機器的“怪異路數”讓解說員屢屢感到吃驚。

在3月10日的賽程中,執黑先行的AlphaGo在開局5秒後在右上角星位落下第一手,李世石第一手則在左下角星位,AlphaGo“思考”1分30多秒後,一改慣用的星布局,將其第二手下在左上角小目,使氣氛頓時緊張起來。

在現代圍棋中,二連星是在外勢與實地之間尋求平衡的布局,而小目布局則以取實地為主。

更讓李世石和職業棋手愕然的是,AlphaGo在右下角下著定式的時候突然抽身將黑13落在上邊,擺起中國流布局。擔任電視解說的金成龍九段驚呼,從未看到有“人”如此下棋。頗感意外的李世石思考了5分鐘後才在左邊落子。

隨後,雙方所用時長逐漸被拉到半個小時以上。有一個細節是,李世石不斷出去抽煙。在比賽進行到快接近尾聲的時候,李世石落子的時候手在抖。知情人柯潔表示,這是李世石緊張的表現。

李世石執白,雙方剩余時間差20分鐘,李世石常規用時率先耗盡。在最後的讀秒階段,雙方膠著,隨後將舉行賽後發布會公布比賽情況。

在連輸兩局的背景下,李世石的心態調整成為了至關重要的因素。在圍棋比賽中,保持一個“平常心”——不管對方是人、是機器,心無雜念,只關注當下的棋局,這一點對李世石來說是輸贏的關鍵。在開局不利的背景下,再加上媒體、大眾對李世石的分析、猜測,都會給李帶來無形的心理壓力,讓其難以以“平常心”應對比賽。

李世石1995年入段,2003年7月獲第16屆富士通杯冠軍後直接升為九段。2006、2007、2008年韓國圍棋大獎——最優秀棋手大獎(MVP)。

作為一名頂尖高手,一般人和李對戰時,都會用求穩的心態避開戰鬥,而AI正好相反。據AlphaGo的設計者透露,職業棋手在考慮下一手布局時,每秒可以考慮到100種可能棋路,AlphaGo每秒則可考慮10萬種棋路,計算速度也比人類快。

在過去的訓練中,AlphaGo至少儲存了三十萬局棋譜,在過去五個月左右手互搏了1.5億局。最可怕的是,無論盤面如何變化,人工智能的情緒都是不受影響的,這些都是不可忽視的客觀事實。也有人評價,“無所謂人類贏還是機器贏,李世石在和一百名程序員戰鬥。”

相較於對弈,AlphaGo的另一位開發者西爾弗(David Silver)更希望外界把關注點放在AlphaGo可以給人類生活帶來的變化上來,勝負不是唯一目的。他說:“‘深藍’很難用於其他領域,但AlphaGo屬於通用程式,人們可以使其學習醫療數據,掌握治療方法,並可以利用它制造出做各種雜務的家用機械人。”

據香港媒體報道,開發AlphaGo的Google DeepMind其中一名創辦人哈薩比斯(Demis Hassabis)表示,將來可能到中國和日本,與兩國的圍棋高手切磋棋藝。

哈薩比斯接受新華社專訪時稱,之所以選擇李世石作為AlphaGo首度挑戰職業九段棋手的對像,是因為李世石保持頂尖下棋水平已有十年,甚至更久,“我們也知道,還有很多實力很強的選手,所以這次比賽之後,也許我們也會去中國、日本,與當地高手切磋棋藝。”

此前,李開復判斷AlphaGo輸給李世石的概率會大一些。李開復講到過去在深藍的時代,雖然深藍成長的很快,但是還是輸了很多次,慢慢學習以後才真的能夠直接打勝冠軍卡斯帕羅夫。AlphaGo也需要一點時間,深藍花費了四年時間,AlphaGo應該需要一年時間。

獵豹移動CEO傅盛也認為此次比賽人工智能不會有大的突破,機器長期來說一定會贏,但3月份能完勝可能性不大。更有聶衛平、俞斌、柯潔等諸多國際頂級棋手堅定地認為人類會戰勝人工智能,李世石會獲勝。

但兩局比賽之後,現在多數人對李世石持悲觀態度。

在圍棋之後,谷歌方面透露,開發AlphaGo的DeepMind公司正考慮將人工智能目標轉移到游戲上,並以星際爭霸作為開始項目制作方案。星際爭霸不僅在視覺上需要處理,同時還需處理類似於大局觀、運營、戰術等多元化信息,AlphaGo還要面對比圍棋更復雜的局面。