【亞太日報訊】4月8日,在《我是歌手》的第四季總決賽中,出現了一個不速之客,這就是揚言能預測歌王的阿裡雲人工智能機器人小Ai。總決賽開場前,小Ai預測黃致列奪冠概率第一,盡管最終的歌王是李玟,但小Ai成功預測了前三名。
在了解阿裡雲人工智能機器人小Ai的基本運作過程後,鈦媒體認為小Ai的算法其實已經不僅是深度學習,而是在深度學習之上的更高階算法,並就此向阿裡雲人工智能科學家閔萬裡求證,得到的回復:是的。
小Ai算法高階在哪裡?
盡管阿裡雲方面沒有透露關於小Ai更多算法方面的信息,只說小Ai主要基於神經網絡、社會計算(social computing)、情緒感知等原理工作,善於洞察本質和實時預測,並能理解人類情感。
但是小Ai挑戰歌王預測難點有三:首先,這是在7個歌手之間的混戰,並非AlphaGo與李世石之間的兩人對弈;其次,唱歌是情感理解加藝術欣賞,不同的唱法、變聲、假聲等無常法也無定論,現場演唱更是即興創作;再次,最終結果是湖南衛視節目組、電視觀眾、500位大眾評審、7位歌手共同創造的結果,其中充滿了巨大的隨機性。
簡單的理解,用於AlphaGo圍棋對弈、語音識別、圖像識別等的深度學習算法,主要解決的是單目標優化問題,而小Ai要挑戰的本質上是多目標優化問題,這從根本上就“迫使”阿裡雲選擇更高階的算法。閔萬裡告訴鈦媒體記者,小Ai本身是一個基於概率的決策優化過程,在決策過程中需要多組變量輸入,其中的部分變量是通過深度學習優化得來。
之前,小Ai的算法已經被阿裡雲成功用於浙江省交通廳的路況預測,而能解決城市管理和宏觀經濟問題的人工智能算法都屬於多目標優化算法。西方已經在城市綜合管理和宏觀政策制定等領域長期采用了多目標優化算法,包括模擬退火算法、遺傳算法等。閔萬裡向鈦媒體稱,小Ai並沒有采用現成的多目標優化算法,而是自己開發的算法體系。
小Ai之父閔萬裡
那麼,小Ai憑什麼能夠實現高階算法呢?這必須要提到小Ai之父、阿裡雲人工智能科學家閔萬裡。
14歲被中科大的少年班錄取,閔萬裡19歲赴美攻讀物理學碩士,2004年獲得芝加哥大學統計學博士,先後在IBM Watson研究院及Google擔任研究員,2013年加入阿裡雲負責人工智能項目小Ai。
閔萬裡說在IBM Watson研究院的經歷讓他受益匪淺。IBM最早提出智慧城市戰略,也是最早看到未來趨勢。2005年,IBM把PC硬件業務賣給聯想後,開始自己的轉型。這個轉型的過程,最缺的就是海量數據分析能力,因此補充了很多相關研究項目,包括海量數據分析、關鍵信息提取、預測建模、機器學習等,閔萬裡也借此接觸了一線實戰案例。
之後到了Google,閔萬裡比較具體地負責移動端廣告精准推送優化研究,主要是對海量數據進行研判,這其實已經非常接近今天小Ai要解決的問題了。移動端廣告精准推送優化是互聯網廣告最核心的技術,需要通過大數據分析和機器學習等提升廣告的精准推送,從而提高廣告的點擊率。
移動端廣告精准推送優化數據分析包括:研判用戶當前上下文網頁的內容;研判用戶所在地理位置——駕車狀態下推送短廣告、飯館裡推送復雜廣告;研判用戶對於推送廣告的喜愛程度等。這些都屬於多情景變量下的實時決策問題,與小Ai要挑戰的歌王預測場景極為類似。
閔萬裡長期從事機器學習理論研究與應用算法研發,在腦電波(EEG)解析、高維數據挖掘、隨機過程理論、時間序列分析、網絡流理論等領域獲得多項國際專利。他於2011年發表的道路交通流預測研究,是該領域全球五年來被引用次數最多的論文之一。
2013年,有獵頭找到閔萬裡,希望游說他加入阿裡雲。當時獵頭說了一句話,中國有這樣一家公司,數據總量比亞馬遜、eBay、Paypal加起來還多。“這一句話就已經可以說明一切了,做大數據就要來阿裡。”閔萬裡如此斷然加入。
小Ai的研發過程
從2012年開始,阿裡雲研發了後來被稱為“MaxCompute”的海量數據處理計算引擎,當時叫做ODPS,這是小Ai非常重要的計算基礎設施。
ODPS是阿裡集團30多個事業部唯一的大數據處理平台,在2015世界Sort Benchmark排序比賽中,ODPS用377秒完成了100TB的數據排序,打破了此前Apache Spark創造的1406秒紀錄,創造了4項世界紀錄。如今,MaxCompute可在6小時內處理100PB數據、相當於1億部高清電影。
值得一提的是ODPS的實時計算系統StreamSQL,後來在阿裡雲數據加平台被稱為“StreamCompute”,可日均處理萬億消息、PB級的數據以及千萬級的每秒查詢率QPS,適用於根據用戶實時行為數據(瀏覽、成交、收藏等)調整推薦商品的實時推薦系統等。
阿裡雲方面說,小Ai的學習速度是人類的1萬倍,人類需要10萬小時成為某一領域的專家,小Ai只需要10小時。這其實就是基於MaxCompute和StreamCompute等阿裡雲大數據分析的實戰平台,“阿裡雲的大數據分析是經過了實戰檢驗,這是與其它平台不一樣的地方。”這個平台經歷了阿裡上萬名工程師的實戰,其中包括7次雙十一的考驗。
在研發MaxCompute等計算平台的同時,阿裡雲人工智能小組還在開發深度學習、社交網絡情感分析、語意分析、優化算法等人工智能算法體系。到2015年的時候,阿裡雲的人工智能算法在阿裡各個業務場景下實現了成熟的應用,之後被抽像成通用的模塊再嫁接到MaxCompute上。
“所以阿裡雲的人工智能模塊帶有明確的可應用場景,不是閉門造車。也不是我們憋了4年,就為做這件事(挑戰《我是歌手》)。這其實是在阿裡整個業務生態中,慢慢成長起來的。”閔萬裡對鈦媒體記者說。
小Ai的算法體系
阿裡雲於2012年就開始人工智能領域的技術研發和儲備。在參加湖南衛視《我是歌手》比賽之前,小Ai已經積累了不少實戰經驗,比如幫助光伏電廠預估發電產能減少能耗、幫助水利監管部門預測水庫水位以預防災害發生、幫助金融機構客服人員接電話、幫助阿裡音樂預測音樂黑馬等等。
小Ai團隊除了工程師、科學家之外,還有多位阿裡音樂和專業人士作為教練,學習了幾百萬首歌提升音樂品味和鑒賞能力。小Ai基於阿裡音樂數據庫,自動學習音頻的重要特征後形成對歌曲的多維度評價,包括音高、能量、語譜、基頻等,通過特征來訓練小Ai對音頻及受歡迎程度之間的關聯性思維,不過目前小Ai還沒有遍歷韓文等外文歌曲。
那麼小Ai是如何現場預測比賽結果的?小Ai從歷史賽事和海量資料中尋找影響比賽結果的變量因子,訓練出一個實時動態模型進行預測,包括歌曲、歌手、粉絲、現場氛圍、網友討論等維度,每種維度都通過機器學習提取海量特征。這些特征有靜態的,也有跟隨比賽而動態變化的,需要現場實時計算。
閔萬裡透露,小Ai眼裡的歌手是無數標簽的集合,比如李玟就有女歌手、70後、華裔、美國、偶像、性感、奧斯卡、R&B、Soul、粉絲量等標簽。而現場影響評委喜好的因素非常多,小Ai需要找到這些影響因素的每一個信息變量,包括歌手演唱相關的曲風、流派、編曲、幫唱嘉賓、舞蹈、歌手顏值等現場熱數據,以及場外的各種冷數據信息。再把這些信息通過一定邏輯疊加在一起,形成整體決策機制。
總結來說,小Ai要做的是去觀察一切可能影響投票結果的因子,整個過程是在全空間、連續、動態地場景中,“理解人類的喜好”、“洞察人類的思考”。
與微軟小冰的區別
作為同樣主打“情感算法”的微軟小冰,閔萬裡表示微軟小冰與人類的一問一答對話很容易帶入上下文情境,之後就可以用語言學等相關的模型進行建模和分析。而小Ai要同時理解7個歌手的混戰以及音樂欣賞等超越語言的內容,這是小Ai的不同之處。
閔萬裡舉例小Ai的算法難點,比如上一次的孫楠退賽完全出乎意料,小Ai也不可能預料到這樣的事件,這對當時的模型訓練造成了很大的困擾。在現場比賽的時候,什麼狀況都有可能發生,不管最後小Ai預測的結果如何,都是一次成功的嘗試。
此外,在商業模式方面,小Ai看起來也不如微軟小冰有一個比較容易的商業化路線,現在微軟正把小冰變成整個微軟產品與服務的人工智能基礎設施。與當前盛行的深度學習算法相比,小Ai的多目標優化算法似乎也難於看到一個清晰的商業化前景。
對於商業化模式問題,閔萬裡說阿裡有一個戰略:Happiness(幸福)和Health(健康),也就是幸福指數與健康指數。小Ai的音樂和藝術欣賞能力,既跟幸福指數相關也與健康指數相關,僅僅實現這一點就已經是巨大的技術成就了。此外,小Ai的能力可以很容易泛化到商業領域,之前已經在交通管理、能源管理、天氣預測等成功應用。
《我是歌手》第四季總決賽中小Ai的實時預測嘗試得到了廣泛關注,IBM也提前為小Ai發來了祝願。更為重要的是,本次預測是多目標優化算法的一次挑戰,可以說也是在中國首次被公眾體驗。