網絡直播被嚴查 看機器如何鑒別小黃圖?

雷鋒網

text

【亞太日報訊】據雷鋒網報道,近日,文化部將19家不合規定的直播平台列入查處名單。

作為新型的社交互動平台,網絡直播與傳統的視頻網站不同,當用戶上傳內容後,傳統的視頻網站會進行審核,符合標准後才可上傳成功,而網絡直播都是實時播出的,如果有人在網上傳播不良信息或者發布違規內容,即使被查處,也是播出之後的事情。

雖然,大多數直播企業會選擇人工審核的方式對直播內容進行實時監管,但是在過去的一年多裡,“直播造人門”、“直播脫衣門”等事件仍然頻繁發生。某直播平台負責人曾表示,視頻直播從技術不需要“上傳”這個步驟,當手機按下攝影功能鍵,雲端會同步抓取、同步存儲、同步傳遞,“延遲不會超過2秒”。在這個過程中,平台面臨的困惑是“無法掌控直播下一秒會發生什麼”,所以只能依靠人力進行24小時輪班審核,但是人工審核存在的問題較多,直播內容監管風險依舊存在。

直播內容監管存在哪些風險?

第一:網絡直播規模龐大,人工審核成本高

2015年直播平台接近200家,用戶數量已經達到2億,大型直播平台每日高峰時間會有3000-4000千個直播“房間”同時在線,用戶數可達兩三百萬人次,如果全部用人工對4000路視頻同時進行審核,為了保證“無漏網之魚”,至少需要上百人同時工作,並且每位工作人員需要配備1-2台監控設備。其實直播視頻內容的違規比例占比不高,僅0.04%,甚至更低,但為了做到“無漏網之魚”,企業需要投入大量的人力、物力和財力進行監管,運營成本壓力增加。

第二:直播流量聚焦夜晚,人工審核效率低

網絡直播白天跟晚上的“房間數”不同,目前,白天直播流量峰值是數百路視頻,晚上可以飆升到數千路。但“三班倒”的審核人員,夜晚疲勞,人眼識別精確度降低,出現誤判漏判的概率上漲,審核效率降低,難以達到網絡直播的內容監管需求。

因此,網絡直播行業的內容監管不能只依賴人工,可以采用機器識別結合人工審核的新型審核模式。

目前,據我所知的,國內能夠為網絡直播企業的違規內容過濾提供這種模式的主要有圖普科技的“智能審核機器人”,阿裡的“阿裡綠網”、騰訊的“萬像優圖”等。

機器識別的工作原理

機器識別原理的圖像識別技術是如何像人腦一樣認識、學習圖像特征的呢?其核心是深度學習理論(Deep Learning)。深度學習就是人工神經網絡(Artificial Neural Network,以下簡稱 ANN)。要了解 ANN,讓我們先來看看人類的大腦是如何工作的。:

人腦的視覺處理系統 via:Simon Thorpe

上圖所表達的,就是人理解外界視覺信息的過程。

從視網膜(Retina)出發,經過低級的 V1 區提取邊 緣特征,到V2 區的基本形狀或目標的局部,再到高層的整個目標(如判定為一張人臉),以及到更高層的 PFC(前額葉皮層)進行分類判斷等。也就是說高層的特征是低層特征的組合, 從低層到高層的特征表達越來越抽像和概念化,也即越來越能表現語義或者意圖。

深度學習,恰恰就是通過組合低層特征形成更加抽像的高層特征(或屬性類別)。然後在這些低層次表達的基礎上,通過線性或者非線性組合,來獲得一個高層次的表達。此外,不僅圖像存在這個規律,聲音也是類似的。

現在來看深度學習的簡易模型。

傳統的神經網絡與深度神經網絡

深度學習的一個主要優勢在於可以利用海量訓練數據(即大數據),在學習的過程中不斷提高識別精度,但是仍然對計算量有很高的要求。而近年來,得益於計算機速度的提升、大規模集群技術的興起、GPU 的應用以及眾多優化算法的出現,耗時數月的訓練過程可縮短為數天甚至數小時,深度學習才逐漸可以用於工業化。

對於開發團隊來說,做該領域的產品困難在於如何獲取大規模已標注數據、集成有 GPU 的 計算集群以及針對自己的項目調參數,團隊需要不斷地輸入新數據,持續迭代以提高機器識別准確率。

審核直播,機器能做什麼?

利用深度學習算法設計的智能程序能通過快速迭代擁有強大的學習能力,並與視頻直播、社交網絡、雲計算等領域企業合作,積累大量圖片和視頻數據,克服智能程序設計中的大數據壁壘,得到高精度的智能識別結果。

例如“鑒黃機器人”,通過將大量人工標注好的色情圖片和正常圖片來訓練機器認識、學習這兩類圖片的特征,然後自動提取出可能是色情圖片和正常圖片的特征,當機器再“看到”相似特征的圖片時,即可自動識別出來,當數據量越大,提取特征越准確,識別精確度越高。上文提到的圖普科技的審核原理也是如此。

因此,新型審核方式的原理就是:

企業根據自身需求,利用自動截圖程序對直播畫面定時(建議6-10s)進行實時截圖,發送到圖像識別雲服務平台,機器自動識別後將結果分為確定和復審兩部分,確認部分的識別精確度達到或超過人工,無需復審,對於復審部分,機器會根據可能性排序,人工再根據概率從高到低來審核。

相對傳統的純人工審核的模式,這種新型審核模式的優勢主要在於:

第一:改變傳統付費模式,成本更低,計費更靈活

直播企業只需要按圖片調用量付費,比如直播平台某日有推廣活動,導致流量較大,需要審核力度較大,付費較多,但活動結束後,審核量減少,費用也會隨之減少,不需要固定每日的付費額度。

第二:機器識別穩定,效率高

機器識別模型可以針對不同的應用場景訓練機器,對於識別結果的確認部分的審核精准度達到99.5%,超過人眼准確度,需要人工復審的部分僅占圖片總量的5%,隨著模型的不斷優化,精確度還會繼續提升,復審率也就繼續降低。

並且成熟運作的智能審核機器人的圖片處理量日達3億張以上,單張圖片響應時間小於0.2s,7x24h全天候服務。但是,如果純人工審核3億張圖片,如果按照人眼每小時審核2萬張左右的圖片計算,則需要大約625天不停歇的工作才能審核完畢,相對人有限的精力,不停運轉的機器明顯更加穩定可控,效率更高。

第三:機器識別更簡單安全

網絡直播采用人工審核時,需要給每個審核人員配備相關設備及空間,因此企業需要投入更多的運營成本,尤其對於創業的網絡直播企業,需要承受的經濟壓力更大,而機器識別只需要通過API調用即可直接使用服務。

此外,每個企業都有專屬的ID賬號,其所有調用數據都會被定期清除,不會長期存留API界面,不同企業之間數據是隔離的,無法調看非本ID的數據,不用擔心企業信息泄漏,安全度更高。

據文化部透露,下一步將重點在經營主體管理、事中事後監管方面對網絡表演關鍵環節進行規範,以及建立違規網絡直播平台和違規“主播”警示名單和黑名單制度,加強行業自律。

所以,網絡直播企業在利用機器識別提高內容監管有效度的同時,還要加大對主播素質培養和監管力度,守住經營的底線與紅線。

(雷鋒網)