文/唐良元(作者單位:英國倫敦大學(xué)高等研究院)
中國著名學(xué)者周海中先生曾經(jīng)指出:“語言智能是人工智能皇冠上的明珠,它對于發(fā)展人類的表達(dá)能力、思維能力、理解能力等具有十分重要的意義。”近年來,由于人工智能的快速發(fā)展,語言智能越來越受到學(xué)術(shù)界,尤其是語言學(xué)界的高度重視和深入研究;在這方面,學(xué)術(shù)界已經(jīng)取得了不少可喜的成果。
語言智能(英文language intelligence)是語言信息智能化的過程,也是運(yùn)用信息技術(shù)模仿人類的智能,分析和處理人類語言的過程,更是人工智能的重要組成部分及人機(jī)交互認(rèn)知的重要基礎(chǔ)和手段。另外,語言智能還有力促進(jìn)語言教學(xué)、語言學(xué)習(xí)的智能化,拓展語言學(xué)研究的新領(lǐng)域,在未來教育發(fā)展中將發(fā)揮越來越重要的作用。
語言智能是信息技術(shù)創(chuàng)新發(fā)展的時代產(chǎn)物。發(fā)展語言智能必須增強(qiáng)科學(xué)意識,只有深刻認(rèn)識語言智能的科學(xué)原理,才能深入研究語言智能這個前沿領(lǐng)域。語言智能基于人腦生理屬性、言語認(rèn)知路徑、語義生成規(guī)律,利用大數(shù)據(jù)與人工智能技術(shù),對語言信息進(jìn)行標(biāo)注、抽取、加工、存儲和特征分析,構(gòu)擬人機(jī)語義同構(gòu)關(guān)系,讓機(jī)器實(shí)施類人言語行為。
語言智能具有文化傳承的服務(wù)優(yōu)勢;語言是文化載體,語言精神反映民族精神。從浩瀚的古典文獻(xiàn)中精選優(yōu)秀傳統(tǒng)文化素材,從當(dāng)下日新月異的語言信息洪流中洗練文化精華,傳遞給當(dāng)代國人,需要語言智能獨(dú)特的算力。從既有的語言文字?jǐn)?shù)據(jù)中分析發(fā)現(xiàn)文化素養(yǎng)和家國情懷,精準(zhǔn)實(shí)施優(yōu)秀文化教育,可以成為語言智能的常態(tài)服務(wù)。
上世紀(jì)80年代,美國著名學(xué)者霍華德?加德納先生認(rèn)為,語言智能就是人們運(yùn)用語言的能力。這種能力是人的認(rèn)知力、思維力、邏輯力、創(chuàng)造力和表達(dá)力的綜合體現(xiàn);而提高語言能力是對語言智能提出的挑戰(zhàn)性問題。這需要采集相應(yīng)數(shù)據(jù),科學(xué)分析個人的知識基礎(chǔ)、思維類型、能力潛質(zhì)等,分析經(jīng)驗(yàn)積累和知識攝取狀況,并通過智能技術(shù)手段來推薦個性化知識學(xué)習(xí)內(nèi)容。
語言理解是語言智能的主要任務(wù),涉及到語言理解的目標(biāo)、途徑和主要模型。機(jī)器對語言的理解就是確定了概念與語言單元的映射,以及知道承載概念單元的語言屬性,和知曉不同語言單元之間的關(guān)系。而語義理解是語言理解的核心,它包括對自然語言知識和常識的學(xué)習(xí);語義理解可以通過一系列的人工智能算法以及多場景智能語義分析,將文本解析為結(jié)構(gòu)化的、機(jī)器可讀的意圖與詞槽信息。
目前語言智能在多個領(lǐng)域都有應(yīng)用,主要是四種類型:分類、生成、抽取和校對。分類問題就是給語言對象打標(biāo)簽,語言對象可以是句子、篇章等;生成問題主要是給原文本生成另一種文本表達(dá),典型的應(yīng)用是機(jī)器翻譯以及人機(jī)對話、自動寫作等;抽取問題就是從研究對象提取想要的答案,讓文本信息處理更加方便;校對問題主要是讓機(jī)器對給定的處理對象,回答對應(yīng)信息是否齊全、是否一致、是否準(zhǔn)確的問題。
近期由美國人工智能公司OpenAI開發(fā)的軟件ChatGPT-4帶來了比ChatGPT背后GPT-3.5更強(qiáng)的推理、計(jì)算、邏輯能力,也引發(fā)了全民使用的熱潮。在技術(shù)發(fā)展方面,GPT-4的訓(xùn)練數(shù)據(jù)涵蓋了互聯(lián)網(wǎng)上的大量網(wǎng)頁、書籍、新聞報(bào)道等,數(shù)據(jù)量達(dá)到了45TB,模型規(guī)模也更大,擁有1750億個參數(shù)。我們期待看到更多的語言模型應(yīng)用在實(shí)際場景中,為語言智能帶來突破性進(jìn)展,也為人類社會帶來更多的便利和創(chuàng)新。
由上可知,語言智能在人工智能研究中扮演著非常重要的角色。其實(shí),人類對語言的學(xué)習(xí)與理解并不是完全通過文本本身來完成的,語言只是其背后具體概念與含義的抽象載體。所以,也許通過多模態(tài)的建模才能讓機(jī)器更好地去理解語言的含義。如何讓機(jī)器學(xué)習(xí)與語言學(xué)結(jié)合得更加緊密,比如對語言的語義信息、語用信息構(gòu)建合適的任務(wù)形式、模型結(jié)構(gòu)、數(shù)據(jù)采集與存儲等也是未來值得關(guān)注的研究方向。
- 無智聯(lián),不AI:品智聯(lián)接數(shù)據(jù)通信商業(yè)市場創(chuàng)新峰會成功舉辦
- 物聯(lián)網(wǎng)智能HVAC:商業(yè)建筑能效提升
- 凈零建筑的策略:太陽能儲能與熱電混合
- 擴(kuò)展生成式人工智能:解鎖實(shí)際業(yè)務(wù)價(jià)值的運(yùn)營模式革新
- 我國移動物聯(lián)網(wǎng)產(chǎn)業(yè)收入首度披露:2024年綜合收入達(dá)到452.71億元
- 建筑管理的未來:把握趨勢,引領(lǐng)變革
- 小米集團(tuán)發(fā)布小米AI眼鏡;海爾已成立機(jī)器人事業(yè)部,也會與宇樹科技探討合作——2025年06月27日
- 綠色云:為互聯(lián)網(wǎng)提供可持續(xù)動力
- 為什么在工業(yè)運(yùn)營中擴(kuò)展視覺人工智能如此困難
- 為何傳統(tǒng)數(shù)據(jù)治理阻礙了人工智能時代的到來
免責(zé)聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請進(jìn)一步核實(shí),并對任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對有關(guān)資料所引致的錯誤、不確或遺漏,概不負(fù)任何法律責(zé)任。任何單位或個人認(rèn)為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權(quán)或存在不實(shí)內(nèi)容時,應(yīng)及時向本網(wǎng)站提出書面權(quán)利通知或不實(shí)情況說明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實(shí)情況證明。本網(wǎng)站在收到上述法律文件后,將會依法盡快聯(lián)系相關(guān)文章源頭核實(shí),溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。