每周一星 | 黃士傑:網絡棋手“Master”幕後真身

亞太日報

text

文 | 亞太日報記者 錢雯秋

從2016年12月29日晚起,一個註冊為“Master”、標註為韓國九段的“網絡棋手”接連“踢館”著名在線圍棋網站弈城網和野狐網。截至2017年1月4日夜,Master已經斬獲了59連勝,擊敗15位世界冠軍,其中包括中國、韓國、日本各自的“當今第一人”柯潔、朴廷桓和井山裕太。尤其是在1月3日晚執白中盤戰勝千呼萬喚始出來的柯潔之後,Master的“踢館”也差不多變成了“表演賽”。1月4日晚間,橫掃圍棋界的神秘網絡棋手“Master”終於揭開了廬山真面目,宣布自己就是AlphaGo,而代為執子的就是AlphaGo團隊的核心角色黃士傑博士!

資料圖片:神秘網絡棋手“Master”引發網絡熱議。最終宣布自己就是AlphaGo黃博士

對於AlphaGo,其實大家並不陌生,早在2016年3月,韓國棋手李世石就與谷歌AlphaGo進行了第一場人機大戰,而當時代替電腦在棋盤上落子的就是阿爾法圍棋的作者之一黃士傑。

作為AlphaGo兩名首席設計師之一的黃士傑博士,是棋力6段業餘高手,無論與樊麾二段還是李世石九段的比賽中,他都坐在對面,成為人機大戰中代替AlphaGo落子的不二人選,被網友戲稱為谷歌圍棋的“人肉臂”。

資料圖片:黃士傑(前排左)操作親手研發的AlphaGo,與韓國棋手李世石(前排右)對弈

黃士傑2011年畢業於台灣師範大學資工系博士班,之後在加拿大Alberta大學做研究,擔任電腦圍棋程序研究員。一年後被英國人工智能公司DeepMind招攬,任資深研究員。2014年,DeepMind公司被谷歌併購,黃士傑更成為兩位首席設計師之一。

黃士傑專精於人工智能領域,碩博士論文都在台師大資工所教授林順喜指導下完成。據林順喜回憶,黃士傑是個很努力的學生,對圍棋也非常有興趣,是台師大圍棋社創社社長,就讀時就有圍棋業餘6段的資格。

林順喜透露,黃士傑的博士本來5年就可念完,但為了延續研發成果,多念了2年,博士班7年級時,他所開發的圍棋程序“Erica”擊敗了當時國際公認的最強程序“Zen”,並在日本舉辦的國際電腦奧林匹亞中拿下19路電腦圍棋金牌。

黃士傑在DeepMind

關於AlphaGo,黃士傑表示,DeepMind 團隊很高興 AlphaGo 讓人工智能有了新的進展。因為圍棋規則很簡單,但是變化相當多。它被視為人工智能開發領域的一大挑戰。1997年,深藍打敗西洋棋冠軍,去年撲克牌也被破解,圍棋變成一直以來僅剩的一個挑戰目標。

他解釋說:“因為西洋棋第一步棋有 80 步,下了第二步之後,有 79 步可以下,圍棋第一步 361 個點,下第二步有 360 點,如果要下到底,大概有 10 的 360 次方的概率,對於電腦來說,很難找到最佳解法。”黃士傑指出,人類在下圍棋,除了平常的計算之外,最主要的是因為“直覺”。透過這個原理,DeepMind 直接讓 AlphaGo 跟深度學習結合,主要的網路是“策略網路”跟“估值網路”。策略網路可以判斷出最佳棋路,就好像人類用直覺來下出好棋一樣,開發團隊也會事先給 AlphaGo 閱讀各種不同參考棋譜;至於“估值網路”則是在搜尋一個點之後,會判對盤面,主要功能就是判斷優勢。

針對未來發展方面,黃士傑表示,DeepMind 有興趣的領域除了圍棋之外,還有“醫療”跟“機器人”,希望能夠讓世界變得更美好。至於他自己個人的下一步,當然就是選一個有興趣的領域去投入。

“策略網路”與“估值網路”圖示:“策略網路”可以判斷出最佳棋路,就好像人類用直覺來下出好棋一樣;“估值網路”則是在搜尋一個點之後,判斷優勢

黃士傑非常鼓勵台灣開發者要勇敢走出去,他表示:“我在師大學習的論文,成為我做出 AlphaGo 的基礎。我覺得台灣很多工程師都很厲害,但是一方面我們的資源比較少、一方面很多人都比較沒有信心。”

他以DeepMind 團隊為例說:“DeepMind 團隊有來自法國、印度、中國、英國、德國、奧地利等世界各國,大家都是離鄉背井,但是企圖心都很強,其中有一個很重要的精神就是要‘開疆破土’,這跟台灣的精神不太一樣,很多台灣人都沒有信心,我們其實不弱,但是要走出去,就能打出一片天。”

資料圖片:2007年台灣大專杯圍棋賽,黃士傑(後排左一)與師大圍棋社學生合影

從去年3月的AlphaGo,到現在升級版的Master,無論未來會出現何種形式的“人機大戰”,科技又一次展現了自己的強大,圍棋這一古老的運動也再度展現了自己的魅力,藤澤秀行先生曾說:“棋道一百,我只知七。”雖然這次表面上是Master橫掃人類高手,但對任何一方來說,這場“七日之戰”都意義非凡。

與Master對戰最後一局的中國棋手古力感慨道:“阿爾法的出現已經徹底顛覆了我們棋手對局勢原有的掌控、判斷。那我不禁要問,多年後的某一天,當你發現自己曾經的意識、認知、抉擇都是錯誤的時候,你會一如即往的錯下去,還是否定自己,給自己重新開始的機會呢?致最好的時代or最壞的時代!”

黃士傑博士在圍棋方面給大家帶來了全新體驗,也期待他今後給我們帶來更多的BetaGo、OmegaGo……在人工智能的道路上,人類也將不斷地刷新認知。“最好的時代or最壞的時代”?不得而知,唯有前行。

(亞太日報綜合報道)