10月28日,由網(wǎng)易科技和網(wǎng)易智能主辦的第七季“網(wǎng)易開物沙龍”在杭州浙江大學(xué)召開,本次沙龍的主題為“AI將引發(fā)生活大爆炸?”。會上,網(wǎng)易杭州研究院執(zhí)行院長汪源發(fā)表了關(guān)于人工智能發(fā)展的演講。
汪源認(rèn)為,當(dāng)前人工智能技術(shù)發(fā)展分為三個(gè)層次,第一個(gè)層次是底層的平臺層,包括深度學(xué)習(xí)平臺。中間的層次是能力層,云計(jì)算、自然語言處理、視覺處理等技術(shù)處于能力層中。第三個(gè)層次是應(yīng)用層,人工智能各種落地的應(yīng)用產(chǎn)品在這一層次中。中間的能力層是當(dāng)前人工智能公司主要的發(fā)力點(diǎn)。
對于人工智能在工程領(lǐng)域應(yīng)用的看法,他認(rèn)為所有的人工智能都是從語音識別,到圖像識別再到自然語言處理。在實(shí)際應(yīng)用場景中,一個(gè)通用的處理技術(shù),比如語音識別,在應(yīng)用到特定場景里的時(shí)候,可能達(dá)不到較好的使用效果。在自然語言處理方面,以客服機(jī)器人舉例,基于傳統(tǒng)知識庫的客服機(jī)器人不是真正意義上的人工智能解決方案,只是通過問題來檢索知識庫??头C(jī)器人要解決多輪對話的問題,涉及到M的機(jī)制、A的機(jī)制,同時(shí)也要解決知識領(lǐng)域的一些問題,客服機(jī)器人實(shí)際上是知識庫的動(dòng)態(tài)學(xué)習(xí),以上這些機(jī)制是為了提高知識庫學(xué)習(xí)的效率。
汪源表示,圖像識別的應(yīng)用場景同文本識別的原理相似,傳統(tǒng)方法在圖片過濾應(yīng)用中解決不了的問題,通過深度學(xué)習(xí)的方式可以做到非常精準(zhǔn)。以網(wǎng)易的圖片鑒黃為例,之前需要一些鑒黃師手動(dòng)篩選,現(xiàn)在依靠深度學(xué)習(xí)的算法能夠做到99.8%的準(zhǔn)確率。
最后,汪源稱當(dāng)前網(wǎng)易的近萬名開發(fā)工程師需要用到機(jī)器學(xué)習(xí)、深度學(xué)習(xí)來解決很多問題,機(jī)器學(xué)習(xí)的能力需要民主化,讓更多的工程師享受到這一技術(shù)成果帶來的紅利,同時(shí)語音識別、圖像識別和智能創(chuàng)作等更多的領(lǐng)域需要應(yīng)用深度學(xué)習(xí)。
以下為演講實(shí)錄:
汪源:剛才吳院長高瞻遠(yuǎn)矚,然后講了很多人工智能激動(dòng)人心的前沿的一些課題。網(wǎng)易作為一家公司,比較側(cè)重于注重技術(shù)跟業(yè)務(wù)相結(jié)合,所以我講的東西可能會比較落地、比較實(shí)際,沒有特別高大上的一些話題,我們可能會先樹立一些小目標(biāo),先解決一些小問題。
先總體上給大家介紹一下網(wǎng)易在人工智能做的相關(guān)工作,分成五六個(gè)部分。
第一個(gè)是介紹一下網(wǎng)易杭州研究院的定位。研究院是06年成立,我剛好在成立的時(shí)候進(jìn)入研究院。網(wǎng)易杭州研究院負(fù)責(zé)創(chuàng)新業(yè)務(wù)的孵化,同時(shí)也負(fù)責(zé)給整個(gè)公司提供公共的基礎(chǔ)平臺的支撐。這個(gè)機(jī)制還是比較特殊的,在國內(nèi)互聯(lián)網(wǎng)企業(yè)中,唯有網(wǎng)易杭州研究院兼具產(chǎn)品、運(yùn)維和公共技術(shù)平臺三重職能和唯一性,為互聯(lián)網(wǎng)技術(shù)研究提供了得天獨(dú)厚的條件。
對于我來講,我要為公司的業(yè)務(wù)提供非常多的技術(shù)支撐,從高大上的人工智能,到不太高大上的質(zhì)量保障都得做。質(zhì)量保障我們也跟人工智能做了相應(yīng)的很好的結(jié)合。
整個(gè)網(wǎng)易杭州研究院主要負(fù)責(zé)構(gòu)建的是互聯(lián)網(wǎng)的技術(shù)體系,七大技術(shù)體系里面其中一個(gè)就是多媒體以及人工智能方向,所以今天講的主要是人工智能方向我們做的一些工作。
這張圖可以囊括一下我們現(xiàn)在人工智能方向主要的工作,其實(shí)人工智能是一個(gè)非常基礎(chǔ)的技術(shù),我在這張圖里面大概做了一個(gè)概括。這里面可以看到分成三個(gè)層次,第一個(gè)層次在底層是平臺層,包括深度學(xué)習(xí)的一個(gè)平臺。中間這個(gè)層次是能力層,云的技術(shù)、自然語言處理的技術(shù)、智能頭像處理的技術(shù)。第三個(gè)是應(yīng)用層,應(yīng)用在網(wǎng)易云、游戲、有道翻譯等產(chǎn)品里面,對公司來講我們從三個(gè)層面,從品牌、能力最后到應(yīng)用的場景,今天主要從中間的能力層展開來講。
第一塊是語音技術(shù)。網(wǎng)易在語音技術(shù)上為了去解決超大規(guī)模的、上萬個(gè)小時(shí)的語音訓(xùn)練問題,我們在云這一塊就把深度學(xué)習(xí)的一個(gè)平臺的技術(shù)帶動(dòng)出來了。
我們大概是在13年的時(shí)候開始做語音識別,網(wǎng)易在現(xiàn)在所有的游戲、社交、易信這些產(chǎn)品里面都是采用我們自研的語音技術(shù)。具體的應(yīng)用場景最主要的是在手游里面使用量非常大,每天的處理請求量達(dá)到五千萬,根據(jù)公開的一個(gè)數(shù)據(jù)來看,這個(gè)量達(dá)到蘋果系統(tǒng)的1/3左右。
這里面我想突出說一點(diǎn),這一點(diǎn)也是我們對人工智能在工程領(lǐng)域應(yīng)用的一個(gè)核心認(rèn)識:所有的人工智能這些能力從語音到圖象到自然語音理解,其實(shí)它都沒有辦法提供一個(gè)非常通用的解決方案。
所以在語音識別我們一開始用的是通用的,后來覺得在游戲里面效果不太理想的,游戲里面涉及到太多跟游戲世界觀相關(guān)的詞匯,還有游戲里面特殊的一些詞。所以我們在自研的過程中針對游戲特定的世界觀進(jìn)行優(yōu)化,獲得比一個(gè)通用的云識別要高一兩個(gè)點(diǎn)的效果。這個(gè)也是我們在實(shí)際的場景里面會不斷的去發(fā)現(xiàn)問題。一個(gè)通用的人工智能能力它在應(yīng)用到特定的場景里面的時(shí)候,可能達(dá)不到一個(gè)很好的使用效果。
另外一個(gè)我們在做的事情,就是發(fā)音評測的工作,主要應(yīng)用在我們有道翻譯里面。
第二塊是自然語言理解方面做的工作,這邊有一些例子,對于自然語言理解,我們現(xiàn)在主要做的工作是用在客服機(jī)器人的應(yīng)用場景里面。
這邊舉了一些客服機(jī)器人的案例。對一個(gè)客服機(jī)器人來講,傳統(tǒng)來講,它是一個(gè)知識庫的一個(gè)檢索的問題,傳統(tǒng)方式并不是一個(gè)人工智能的解決方案。這個(gè)用戶體驗(yàn)也是很差的。所以現(xiàn)在你如果要提供一個(gè)用戶體驗(yàn)比較好的客服機(jī)器人,那它需要支持比較智能的多輪對話的方式。人跟人之間的對話不是說直接一問一答問題就解決了,它是需要機(jī)器人能夠了解到這個(gè)領(lǐng)域的知識。我舉個(gè)例子,比如我要打車,我說我要打車到浙大紫金港校區(qū),他應(yīng)該知道浙大紫金港校區(qū)是有東門、南門的,它會追問請問你到哪個(gè)門,因?yàn)檫@是兩個(gè)不同的點(diǎn),這個(gè)其實(shí)就涉及到領(lǐng)域的知識。
我很難具體來講怎么樣從技術(shù)上、細(xì)節(jié)上做到這一點(diǎn),總體來講對于大家做客服機(jī)器人,首先要有一種方式解決多輪對話的問題,這里面可能會涉及到M的機(jī)制、A的機(jī)制,同時(shí)也要解決領(lǐng)域知識的一些問題。這里面就需要用到比如說知識圖譜的方式,還需要針對特定的一個(gè)行業(yè)去做定制。我們做的像知識庫的一個(gè)動(dòng)態(tài)學(xué)習(xí),那這個(gè)機(jī)制是為了能夠提高知識庫學(xué)習(xí)的效率,但是并沒有一個(gè)特別通用的方案可以客服機(jī)器人一下能夠無所不能,能夠回答所有的問題,這是不現(xiàn)實(shí)的。
這個(gè)是文本過濾。我們的網(wǎng)易新聞?dòng)幸粋€(gè)很好的功能叫跟貼,跟貼其實(shí)就是用戶發(fā)表評論,我們把它設(shè)計(jì)成蓋樓的方式,但這個(gè)評論里面會涉及到非常多垃圾有害信息。我們的人工智能技術(shù)也會用在這里。UGC的產(chǎn)品里面大量的用戶評論容易產(chǎn)生不恰當(dāng)?shù)牡胤?,傳統(tǒng)的關(guān)健詞過濾技術(shù)解決不了復(fù)雜的垃圾變化,比如拆字,各種組合方式。這時(shí)候,通過自然語言理解,通過深度學(xué)習(xí)的方式能夠做到比較好的效果。
第三塊智能圖象識別。智能圖象識別它的主要應(yīng)用場景跟剛才說的文本的識別、文本的過濾是類似的。我們有很多產(chǎn)品里面用戶會曬圖,這個(gè)圖片是不是有不合適的內(nèi)容,里面有爆恐的、不良廣告或者色情的圖像,傳統(tǒng)的方式也解決不了,但是現(xiàn)在通過深度學(xué)習(xí)的方式也可以做到非常好的,非常精準(zhǔn)的效果。
對于色情圖片,對于圖片鑒黃,從06年我開始做研究院工作,06年我們的鑒黃師用什么來做的?在一個(gè)小黑屋養(yǎng)一堆鑒黃師,那時(shí)候量比較少,很辛苦也很幸福。那個(gè)時(shí)候如果用算法判斷,實(shí)際上是很困難的,比如用簡單的一些膚色識別方式是很麻煩的。稍微做一些編輯你又被它逃掉了,而且你的庫不可能非常全面準(zhǔn)確。所以它的準(zhǔn)確率只有5%。
第二個(gè)階段通過膚色識別,準(zhǔn)確率只能做到60%,基本上處于不可用的狀態(tài),還有40%是錯(cuò)誤的,60減40就剩20%,這個(gè)技術(shù)基本上沒有用。
直到第三代深度學(xué)習(xí)的做法才做到99.8%這樣非常高的準(zhǔn)確率。同時(shí),我們還會用機(jī)器加人工智能的方式避免誤判。這個(gè)技術(shù)我們現(xiàn)在提供對外的服務(wù),叫網(wǎng)易易盾。
后面說一下我們未來想做的事情,第一個(gè)進(jìn)一步加強(qiáng)人工智能的深度學(xué)習(xí)平臺,因?yàn)槲覀儸F(xiàn)有非常多的應(yīng)用都需要用到深度學(xué)習(xí)。幾乎每過一年都會發(fā)現(xiàn)很多算法會被深度學(xué)習(xí)代替。比如我們現(xiàn)在在做基于深度學(xué)習(xí)的翻譯,翻譯效果比原來統(tǒng)計(jì)的翻譯效果會好很多。對于網(wǎng)易來講現(xiàn)在有近萬名的開發(fā)工程師,這里面有很多的工程師可能就需要用到機(jī)器學(xué)習(xí),用到深度學(xué)習(xí)解決很多問題。我們必須把這個(gè)機(jī)器學(xué)習(xí)的能力普及化,讓大家一些普通的工程師,前期比較優(yōu)秀的工程師都能夠使用這么一個(gè)工具,所以我們會去做一個(gè)深度學(xué)習(xí)的很便捷的機(jī)器學(xué)習(xí)平臺,這個(gè)對于網(wǎng)易來講是一個(gè)非?;A(chǔ)的工作。
第二個(gè)我們希望在語音識別、圖像識別、智能創(chuàng)作這些更多的領(lǐng)域來去深入應(yīng)用深度學(xué)習(xí)技術(shù)。
我今天的介紹就到這里,謝謝大家。
- 國補(bǔ)2025最新消息:國家補(bǔ)貼怎么領(lǐng)取?手機(jī)家電國補(bǔ)領(lǐng)取入口方法步驟和申請流程
- 華為新旗艦Pura 80震撼登場:一英寸大底+5000萬高分辨率,視覺革命即將來臨
- 百年匠心傳承,共繪國色新篇——馬利106周年暨產(chǎn)教融合創(chuàng)新成果發(fā)布會圓滿舉行
- 韓國五大企業(yè)巨頭去年總銷售額占GDP近四成,經(jīng)濟(jì)巨頭背后的力量之謎
- 四足機(jī)器人研發(fā)者:從研二到創(chuàng)業(yè)大賽冠軍,王興興的科技之路
- 蘋果App Store去年抽成破百億,翻兩番,用戶遭重稅?
- 比亞迪新能源軍艦揚(yáng)帆南美,巴西市場萬輛比亞迪新能源汽車蓄勢待發(fā)
- 從零到千萬:揭秘小紅書教培新秀成長路徑,單季增長10倍的秘密武器
- 情緒消費(fèi)熱潮:年輕人假期剛需,脫口秀與八段錦治愈心靈的新選擇
- 零食市場洗牌:競爭激烈,突圍之戰(zhàn)即將上演
免責(zé)聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請進(jìn)一步核實(shí),并對任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對有關(guān)資料所引致的錯(cuò)誤、不確或遺漏,概不負(fù)任何法律責(zé)任。任何單位或個(gè)人認(rèn)為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權(quán)或存在不實(shí)內(nèi)容時(shí),應(yīng)及時(shí)向本網(wǎng)站提出書面權(quán)利通知或不實(shí)情況說明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實(shí)情況證明。本網(wǎng)站在收到上述法律文件后,將會依法盡快聯(lián)系相關(guān)文章源頭核實(shí),溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。