下一個十年:數(shù)據(jù)信仰與認知智能

原標題:下一個十年:數(shù)據(jù)信仰與認知智能

下一個十年,哪些技術(shù)將帶來革命性的改變?

在一個新技術(shù)層出不窮的時代,對于這個問題,恐怕大部分企業(yè)與組織都在積極思考。

百分點技術(shù)副總裁兼首席架構(gòu)師劉譯璟博士認為,在產(chǎn)業(yè)數(shù)字化逐步深入的趨勢下,以自然語言處理(NLP)、知識圖譜為代表的認知智能技術(shù)將會以場景為切入點,通過以點帶面、從局部到整體、層層推進的方式實現(xiàn)突破,從而為數(shù)字世界的交互與決策帶來顛覆性改變。

百分點技術(shù)副總裁兼首席架構(gòu)師劉譯璟博士

為什么認知智能技術(shù)得到業(yè)界如此重視呢?這一切還得從數(shù)據(jù)開始說起……

//

數(shù)據(jù)信仰正在加速形成

//

尤瓦爾赫拉利曾在《未來簡史》中預言:數(shù)據(jù)將成為人們未來的信仰。

現(xiàn)實情況中,企業(yè)與組織對于數(shù)據(jù)及其價值的認可度也在迅速提升。業(yè)界普遍認為,數(shù)據(jù)正在成為一種新型的生產(chǎn)資料,是未來企業(yè)/組織業(yè)務運轉(zhuǎn)中不可或缺的要素。一位制造業(yè)企業(yè)CIO在向筆者談到數(shù)據(jù)驅(qū)動業(yè)務時表示:“隨著研發(fā)、制造、倉儲、物流、服務等業(yè)務環(huán)節(jié)的數(shù)據(jù)全方位打通,為大數(shù)據(jù)、物聯(lián)網(wǎng)、人工智能等技術(shù)的應用奠定了重要基礎,智能制造已經(jīng)不再是空想,未來將是數(shù)據(jù)進驅(qū)動業(yè)務。”

事實上,類似這樣的企業(yè)不占少數(shù)。產(chǎn)業(yè)數(shù)字化和企業(yè)數(shù)字化轉(zhuǎn)型的大浪潮下,基于數(shù)據(jù)的能力正在加速顯現(xiàn),并且得到越來越多用戶的認可。就如IDG《2018中國企業(yè)數(shù)字化發(fā)展報告》中提到,企業(yè)在數(shù)字化轉(zhuǎn)型過程中將逐步形成變革能力、敏捷能力、利用生態(tài)的能力、數(shù)字化產(chǎn)品與服務、數(shù)據(jù)資產(chǎn)化能力、經(jīng)驗數(shù)據(jù)化能力,這一切的基礎就是數(shù)據(jù)。

劉譯璟博士直言,用數(shù)據(jù)的角度去看待業(yè)務和現(xiàn)實,在觀念上是一個巨大的轉(zhuǎn)變,隨著數(shù)字化程度越來越高,一個與物理世界相對于的數(shù)字世界在加速形成,并且物理世界與數(shù)字世界之間的交互會愈發(fā)頻繁。因此,感知智能、認知智能等人工智能技術(shù)將會有巨大的用武之地,用戶對于數(shù)據(jù)的信仰也將會加速形成。

//

從感知到認知:靠深度學習不夠

//

眾所周知,得益于算力大幅提升、數(shù)據(jù)愈發(fā)豐富以及以深度學習為代表的算法突破,以圖像識別、語音識別為代表的感知智能技術(shù)近年來取得了突飛猛進的進步,并且在金融、零售、教育、安防、智慧城市等多行業(yè)與領(lǐng)域得到了應用。

不過,這還遠遠不夠。

從技術(shù)發(fā)展的角度來看,從感知智能向認知智能是必然趨勢,因為無論是圖像中事物關(guān)系,還是語言中語義,都需要進行識別、理解,這恰恰正是認知智能技術(shù)正在努力解決的事情;從現(xiàn)實的角度來看,認知智能技術(shù)可以從海量數(shù)據(jù)中不斷挖掘、提煉和匯聚知識,人們渴望有更深層次的認知,從而更好地了解客觀世界。

在劉譯璟看來,感知智能技術(shù)很快會在實際業(yè)務中遇到瓶頸,比如在語音識別中,如果只做文字層面的轉(zhuǎn)換,而不能從認知層面去理解文本/文字的含義,那么對于用戶的價值其實并不高;未來一定需要從認知層面去理解視覺中動作的含義、文字中語義與含義,從而了解業(yè)務變化并為決策提供支撐?!皬臄?shù)據(jù)到信息,再到知識,認知智能技術(shù)將發(fā)揮至關(guān)重要的作用?!?/span>

對于深度學習,劉譯璟博士認為,深度學習技術(shù)的確是推動了感知智能技術(shù)的快速發(fā)展,但是僅僅依靠深度學習技術(shù)是遠遠不夠的,深度學習是純粹基于數(shù)據(jù)的方法,屬于歸納的范疇,并不具有可解釋性,在一定階段后具有明顯的瓶頸,從感知智能走向認知智能,僅僅依靠深度學習是遠遠不夠的,還需要有更多突破。

//

認知智能:到底應該如何突破?

//

某種程度而言,認知智能技術(shù)的發(fā)展并沒有像感知智能那樣快速,依然有著眾多挑戰(zhàn)等待突破。

雖然近年來很多大公司在努力推動包括云計算、大數(shù)據(jù)、人工智能技術(shù)的發(fā)展,構(gòu)建出系列技術(shù)平臺,希望屏蔽掉底層技術(shù)的復雜性,推動包括認知智能技術(shù)在內(nèi)的應用發(fā)展,但在實際業(yè)務場景中應用并未取得令人滿意。

劉譯璟直言,人工智能的變革需要場景應用來驅(qū)動。正所謂是,獨立存在不是技術(shù)追求的目標,依托場景應用才是技術(shù)存在的真實意義。劉譯璟認為,以知識圖譜、自然語言處理為代表認知智能技術(shù)的確還有很多需要突破的地方,長期在行業(yè)場景實踐中實現(xiàn)突破是最佳的方式。

對于任何一項新技術(shù)都不能在一開始就抱有不切實際的幻想?!安荒苓^分夸大人工智能技術(shù)現(xiàn)階段的能力,以自動駕駛位列,L5級別的自動駕駛現(xiàn)階段的確是非常難實現(xiàn),因為它要求機器在任何時候都比人做的好。但是我們可以先從一些特定場景中實現(xiàn)突破,繼而逐步實現(xiàn)更多場景的應用。像自動駕駛在目前城市出租車、園區(qū)接駁車這些場景中就已經(jīng)得到實現(xiàn)和突破。”劉譯璟補充道。

“未來3-5年,認知智能一定會取得更多突破?!眲⒆g璟表示,人工智能進入到中期之后,將會更多的下沉到各個行業(yè)之中,將會更多更加具體的業(yè)務場景,意味著專業(yè)化程度會更高,可用的數(shù)據(jù)也將更少,專家和方法的重要性會大幅提高?!跋裰R工程、語義分析這些認知智能層面的技術(shù)將再次興起?!?/span>

在眾多認知智能技術(shù)中,自然語言處理被認為是人工智能皇冠上的明珠,而知識圖譜則被認為人工智能的基石,那么對于這兩項重要的認知智能技術(shù),未來又會有哪些具體挑戰(zhàn)?

//

如何讓自然語言處理綻放光芒?

//

物理世界與數(shù)字世界之間的交互與交流,自然語言處理技術(shù)是必不可少。

筆者認為自然語言處理一定會在未來得到更多發(fā)展和應用。某種程度而言,自然語言處理正在重新定義人與機器,物理世界與數(shù)字世界之間的交互方式,過去依靠屏幕、鍵盤的交互方式,會越來越多被語音、動作所取代,這時就需要自然語言處理來理解、判斷和推理。

事實上,自然語言處理技術(shù)已經(jīng)在不同行業(yè)的多項業(yè)務中得到了初步的使用,比如智能客服、智能翻譯、智能機器人等。但是,從目前來看,大部分的應用的效果其實沒有符合大眾的期望值。業(yè)界也普遍認為,自然語言處理依然存在著很大的挑戰(zhàn)。

百分點首席算法科學家蘇海波博士認為,自然語言處理技術(shù)的突破的確是目前業(yè)界的巨大挑戰(zhàn)。在他看來,挑戰(zhàn)主要包括:帶標識數(shù)據(jù)嚴重不足、文本遷移、文本推理、多模態(tài)融合的文本理解等等?!艾F(xiàn)階段,沒有通用的自然語言處理技術(shù)。自然語言處理四個層面主要為:形式、語義、推理和語用,現(xiàn)階段自然語言處理在從語義到推理的階段發(fā)展?!?/span>

蘇海波博士介紹:“在語料足夠豐富的場景下,比如智能問答、智能客服等,深度學習借助足夠的場景標注語料,自然語言處理是可以達到不錯的效果。但是百分點在大量實際客戶場景中發(fā)現(xiàn),用戶面臨最實際的問題就是如何在標注樣本比較少的情況下,也能運用好深度學習技術(shù),實現(xiàn)更佳的效果?!?/span>

根據(jù)蘇海波介紹,業(yè)界目前的趨勢是融合,希望利用融合來實現(xiàn)自然語言處理技術(shù)的突破,比如Google提出的BERT預訓練語言模型,先去預先訓練和學習很多知識,然后融入到語言模型中,再結(jié)合用戶的具體場景,達到預想效果?!斑@種方式雖然標注樣本較少,但是同樣可以達到非常好的效果?!?/span>

百分點首席算法科學家蘇海波博士

蘇海波博士介紹,百分點目前也積極在一些客戶的場景中采用這種思路去提升NLP效果,并且取得了非常不錯的效果?!邦A訓練語言模型類似遷移學習的思想,把之前的學習遷移到不同的場景中,這將在本質(zhì)上突破NLP?!?/span>

“自然語言處理的突破指日可待,未來它的黃金時代即將到來?!碧K海波博士表示。

//

知識圖譜:認知智能的基石

//

如果說人工智能面臨兩大難題,一是人機交互,那另外一個就是行業(yè)知識、專家資源的匱乏。

這也是知識圖譜的價值所在。所謂知識圖譜,就是通過知識的關(guān)聯(lián)性形成一個網(wǎng)狀的知識結(jié)構(gòu),形成知識圖譜的過程本質(zhì)是在建立認知,理解世界、應用或業(yè)務。機器通過知識圖譜可以更智能地從客觀世界中獲得知識,從而更加智能。

尤其是人工智能技術(shù)越往行業(yè)中下沉,越會面臨著專業(yè)數(shù)據(jù)、知識匱乏的難題,缺乏相關(guān)訓練的數(shù)據(jù)來源。劉譯璟博士直言,傳統(tǒng)機器學習都是歸納的方法。如果在一個新的領(lǐng)域,缺乏足夠的數(shù)據(jù)將會面臨冷啟動的問題,這時候就必須需要人的經(jīng)驗和知識,將對業(yè)務的理解和認知告訴機器,這種對話就是知識圖譜,當機器形成一定規(guī)模之后,就可以實現(xiàn)知識的共享。

“沒有人工,就沒有智能?!蹦壳埃ㄓ眯灾R圖譜已經(jīng)逐漸構(gòu)建成熟,而行業(yè)知識圖譜則剛剛興起。如何構(gòu)建一套適合這個行業(yè)比較有使用價值的知識圖譜,則必須借助業(yè)務專家。劉譯璟表示:“在一個具體行業(yè)中,不可能像通用知識圖譜那樣去實現(xiàn),必須借助業(yè)務專家,有了本體之后去對接數(shù)據(jù)和應用。”

去年,百分點提出了動態(tài)知識圖譜的概念。劉譯璟強調(diào),動態(tài)知識圖譜核心價值在于動態(tài),即人對于業(yè)務的理解不是一層不變的,這種理解隨時隨刻都可能發(fā)生改變,動態(tài)知識圖譜就是可以快速反應出人的這種認知變化。

//

下一個十年:從這場發(fā)布會開始!

//

作為國內(nèi)企業(yè)級大數(shù)據(jù)+人工智能技術(shù)與應用服務商,百分點一直走在人工智能應用的最前沿,多年以來專注于大數(shù)據(jù)操作系統(tǒng)、智能認知產(chǎn)品以及智能決策應用場景的落地,并致力于大數(shù)據(jù)、人工智能技術(shù)在行業(yè)中的落地與應用,在大數(shù)據(jù)、認知智能技術(shù)積累了豐富的實踐經(jīng)驗。

11月29日,百分點將發(fā)布基于大數(shù)據(jù)+認知智能技術(shù)的最新產(chǎn)品、成立認知智能實驗室。此次新品的發(fā)布,這將會是百分點在大數(shù)據(jù)+人工智能領(lǐng)域的又一次沉淀。

對于認知智能,一直走在實踐最前沿的百分點會給我們帶來什么驚喜,敬請期待!

免責聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準確性及可靠性,但不保證有關(guān)資料的準確性及可靠性,讀者在使用前請進一步核實,并對任何自主決定的行為負責。本網(wǎng)站對有關(guān)資料所引致的錯誤、不確或遺漏,概不負任何法律責任。任何單位或個人認為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權(quán)或存在不實內(nèi)容時,應及時向本網(wǎng)站提出書面權(quán)利通知或不實情況說明,并提供身份證明、權(quán)屬證明及詳細侵權(quán)或不實情況證明。本網(wǎng)站在收到上述法律文件后,將會依法盡快聯(lián)系相關(guān)文章源頭核實,溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。

2018-11-23
下一個十年:數(shù)據(jù)信仰與認知智能
從感知到認知:靠深度學習不夠 從技術(shù)發(fā)展的角度來看,從感知智能向認知智能是必然趨勢,因為無論是圖像中事物關(guān)系,還是語言中語義,都需要進行識別、理解,這恰恰正是認知智能技術(shù)正在努力解決的…

長按掃碼 閱讀全文