深度學習:人工智能的正循環

虎嗅網

text

1、Andrew Ng和深度學習

對於Andrew Ng,大家最熟悉的事件可能是他在谷歌期間借助深度學習讓機器通過對數百萬份 YouTube 視頻的學習自行掌握了“貓的概念,這成為世界深度學習領域廣為人知的成功案例之一,也成為對谷歌人工神經網路“DistBelief的一次有力驗證。

80 年代初期,當時的人工智能研究都在試圖尋找捷徑,希望可以繞過人腦神經網路來直接類比出行為,而不是試圖通過模仿大腦運作來實現。但有兩位技術牛人一直堅持研究類比神經網路的深度學習,最終他們的演算法得到了全球人工智能界和科技公司的關注和重視,他們就是深度學習的領軍人物、後來分別被谷歌和Facebook招致麾下的Hinton 和 LeCun。Andrew Ng在大學時期曾經一度放棄了人工智能的研究,直到後來被Jeff Hawkins(Palm創始人,《人工智能的未來》作者)的HTM演算法(意思是人類智慧來源於這個單一演算法)所影響,重新開始了對人工智能的研究,而他的研究方向一直是深度學習。

如今,已經轉投百度的Andrew Ng在不久前的百度世界大會上再次強調了深度學習對人工智能的重要意義。從目前看來,深度學習是實現人工智能最有效、也是取得成效最大的實施方法。Andrew Ng在演講中提到目前百度大腦的新演算法就是屬於深度學習,他雖然沒有具體指明該演算法的領先程度,但卻強調了其在處理資料方面比傳統人工智能演算法存在的優越性,並可以使人工智能實現一種正循環。

2、奇點臨近——人工智能的正循環

人工智能的正循環是Andrew Ng演講中的核心要點,在擁有深度學習演算法之後,將不再懼怕海量資料,反而會因為資料的增長而取得更好的效果,而這些效果將直接體現在圖像搜索、語音辨識等具體的互聯網服務中,從而為使用者提供更好服務並吸引更多使用者,這又會產生更多資料。

“人工智能正循環的確令人興奮,但人工智能技術發展了幾十年,為何恰恰在今天有條件實現正循環?我在文章搜尋引擎到人工智能的終極演進提到了搜尋引擎到人工智能演進的幾個重點條件,包括搜素引擎積累的戰略資料、類比神經網路的機器學習,從Andrew Ng的演講中已經證實了這兩個條件的成熟,他提到“百度有海量資料以及“百度大腦的新演算法。還有一個重要條件是“技術奇點的出現,指在積累資料的前提下,硬體存儲、超級計算和類比神經網路等相關技術的成熟。

庫茲韋爾在《奇點臨近》一書中提到,奇點思想是:人類創造技術的節奏正在加速,技術的力量也正以指數級得速度在增長。指數級的增長是具有迷惑性的,它始於極微小的增長,隨後又以不可思議的速度爆炸式地增長。

對於人工智能來說,深度學習的出現就是這樣一個奇點。面對海量資料,深度學習演算法可以做到傳統人工智能演算法無法做到的事情,而且輸出結果會隨著資料處理量的增大而更加準確。

傳統機器學習是通過標記資料和有監督學習,這意味著,如果想讓機器學會如何識別某一特定物件,就必須人為干預對樣本進行標注,也就是說,隨著其所需處理資料量的增大,外界對其的支持和幫助也就更大,而且計算結果的準確性也會受到影響。因此,對於這種傳統演算法,越來越多的資料將成為負擔,也更容易達到極限或產生錯誤結果。但深度學習是從未經標記的資料展開學習,這更接近人腦的學習方式,可以通過訓練之後自行掌握概念,這將大幅度提高電腦處理資訊的效率。王威廉在《國際機器學習大會ICML2013參會感想》提到:“用半監督或無監督學習方法挖掘無標籤的資料,不僅是過去10年,還很可能是大資料時代的一個熱點。拿機器視覺舉例,機器學習是通過構建多層類似人類視覺神經系統的演算法使機器自行明白物體整體的形態,而傳統的人工智能演算法往往需要工程師人工輸入物體視覺或者聲音的資訊,然後由機器學習演算法來處理這些資訊資料。

在加速回歸定律的指引下,深度學習將使人工智能的進化節奏加快,並時進化過程中產物(輸出結果)獲得指數級增長。當深度學習的效率變得更高,就會吸引更多的資源向它聚合,使其發展更為迅速。同時,這些指數級增長都來源於我們對互聯網產品的每一次微小的使用以及相應的每次資料的貢獻。而這些彙集起來的資料再借助深度學習演算法就會為會我們輸出更加準確的結果,提供更好的服務,其產生的效果也會像滾雪球一樣越來越大。

3、深度學習帶來的重要意義

深度學習帶來了人工智能的正循環,那這對於我們來說意味著什麼?Andrew Ng曾提出,深度學習演算法可以使機器“自己學會世界上的一些概念,也就是機器將具備一定的人類般的學習和思考能力。人類自身的學習能力可以説明我們自行認識世界,而當機器當過模擬人腦具備了這一能力之後,就可以在一定程度上取代我們部分腦力工作。就像在工業革命和電力革命的影響力,我們自身從體力勞動中解放出來一樣,在深度學習所帶來的人工智能革命下,我們同樣可以將腦力工作外包給機器。

深度學習使機器更加聰明,但我們在這方面應保持足夠謹慎,不能過分誇大。我們不需要去考慮“機器智慧何時超越人類等略顯科幻的問題,我們僅需要明白這些機器智慧將不斷下落到具體的互聯網應用中,帶給我們更加智慧的服務。比如說,通過視覺獲取和處理圖像、通過聲音講出語言是人類最自然的與外界溝通的方式,但傳統的電腦服務卻無法從本質上讀懂我們這些內容,當我們進行圖像搜索或者向電腦發送某項指令時,我們需要預先在大腦中做一遍處理,將我們原本要表達的意思轉化成電腦能夠讀懂的文本資訊,然後手動輸入到電腦並獲得結果。但在機器學習的幫助下,我們隨意把一張圖片丟給電腦就能返回結果,我們直接用語言就可以來命令電腦來為我們提供各種服務。

就像Andrew Ng提到的“(移動)新設備更需要提供更自然的方式找到服務,而這就是機器學習最實際、最恰當的用途。奇點是未來的一個時期:技術變革的節奏如此迅速,其所帶來的影響如此深遠,人類的生活將不避免的發生改變。Andrew Ng的深度學習帶來了“人工智能的正循環,給用戶帶來了更好的互聯網服務,這表明或許人工智能的奇點已經到來。而至於要走向何方,Hinton 的一句自述也可以很恰當的用在Andrew Ng 身上——“我們希望把 AI帶到一個美妙的新領域,一個還沒有人或者程式到達的境界。