近日,智言科技AI團隊刷新CommonsenseQA數(shù)據(jù)集世界排名,以超出第二名3個百分點的成績位列榜單第一。該榜單參與團隊包括微軟亞洲研究院、阿里達摩院、FacebookAI、CMU等。以常識性問答為應(yīng)用是 NLP 最重要的前進方向之一,其目的是幫助計算機通過已有的知識來推理判斷未見過的輸入信息,從而使計算機更理解人的意思。
CommonsenseQA任務(wù)由以色列特拉維夫大學建立,是一個新的多項選擇題答案數(shù)據(jù)集,它需要不同類型的常識知識來預(yù)測正確的答案,是極具有挑戰(zhàn)性的數(shù)據(jù)集。數(shù)據(jù)集中的12102個問題,包含一個正確答案和四個干擾因素答案,測試結(jié)果每兩周評估一次。目前排名第一的智言科技團隊獲得76.5%的準確性,在排名中超越第二名3個百分點,在NLP領(lǐng)域中已是很大的進步和超越,但是仍低于人類88.9%的水平,可見NLP在常識性推理方向仍有很大挑戰(zhàn)和進步空間。
CommonsenseQALeaderBoard,智言科技目前排名第一
當人類回答問題時,他們會依據(jù)常識、背景知識、空間關(guān)系、原因、結(jié)果、科學事實和社會慣例等,來判斷問題答案。例如,提出了一個問題:“當李蒙聽到割草機的聲音時,他在哪里?”可以推斷割草機靠近李蒙時,同時可能在戶外并位于街道上。這種知識對人類而言似乎微不足道,但是仍然超出了當前的自然語言理解(NLU)系統(tǒng)。
當前閱讀理解模型主要所關(guān)注的問題類型是事實類問題(factoid questions),這類型的問題答案往往能直接在原文中找到,然而如何基于常識和背景知識進行推理以獲得答案仍舊是一個巨大的挑戰(zhàn)。數(shù)據(jù)集 CommonsenseQA、CosmosQA 等相繼被提出便是為了促進該方向的發(fā)展。在這些數(shù)據(jù)集中,機器需要結(jié)合常識知識來回答諸如“我可以站在河上的什么地方看水流而不會弄濕自己?”這樣的問題,因此更具挑戰(zhàn)性。
如果想人工智能要更好地服務(wù)于人類、更多地介入人類的日常生活,人工智能機器人就需要理解人類自然語言的意義,提前學習、掌握常識并據(jù)此進行推理。大家已經(jīng)充分地認識到:人工智能的下一步發(fā)展和實用化,必須突破語義理解和常識推理這一瓶頸。我們認為語義理解和常識推理研究的進展,依賴于全新的自然語言處理技術(shù)和理念。
在商業(yè)化應(yīng)用當中,人工智能帶來的首先應(yīng)該是商業(yè)模式上的轉(zhuǎn)變,然后是運用的效率轉(zhuǎn)變。智言科技的AI團隊始終專注于自然語言處理領(lǐng)域的技術(shù)突破,同時將知識圖譜融入其中,幫助傳統(tǒng)企業(yè)進行數(shù)字化轉(zhuǎn)型?;诙鄠€垂直行業(yè)的大量對話應(yīng)用場景,智言科技在自然語言理解、意圖識別及邏輯推理等技術(shù)上取得了較好的效果。
對于企業(yè)員工來說,客戶所提出的問題相似度很高,使得工作重復(fù)繁瑣,這部分工作已經(jīng)實現(xiàn)人工智能技術(shù)的部分替代性,有效提高工作效率,降低企業(yè)運營成本。除此之外,在常規(guī)問答中,為了提高機器人的問答能力邊界,以知識圖譜形式應(yīng)用的非結(jié)構(gòu)化數(shù)據(jù)、對話的數(shù)據(jù)不斷累積,從而優(yōu)化語料庫、提高準確率。這些數(shù)據(jù)也是企業(yè)未來數(shù)字化轉(zhuǎn)型的新燃料。
目前市面上大部分的商業(yè)落地項目主要采用深度學習的技術(shù)提高模型的識別率以及對話準確度,這樣的方式需要大量的數(shù)據(jù)。到了一個階段之后,即使加大數(shù)據(jù)量也無法提高模型的準確率,且過程無法解釋,開放領(lǐng)域的多輪對話目前還處在弱人工智能的階段。智言科技的知識圖譜+深度學習的優(yōu)勢是數(shù)據(jù)量小、過程可以解釋、準確度高,將兩項結(jié)合為強人工智能奠定基礎(chǔ)。例如,智言科技在金融領(lǐng)域,已經(jīng)構(gòu)建了數(shù)十萬份非結(jié)構(gòu)化文檔的知識圖譜,成為支撐落地應(yīng)用中的數(shù)據(jù)源動力。同時,為了更好的完成企業(yè)智能化應(yīng)用的閉環(huán),智言科技AI團隊在圖像識別、語音識別、語音合成等領(lǐng)域都在不斷探索,從而為用戶帶來更好的智能化體驗。
智言科技構(gòu)建非結(jié)構(gòu)化文檔形成為知識圖譜
人工智能勢必將對人們的工作產(chǎn)生深刻影響,因此建立新的內(nèi)部業(yè)務(wù)模式流程變得前所未有的緊迫。一些領(lǐng)先的企業(yè)認識到,人工智能將對業(yè)務(wù)模式、員工結(jié)果及客戶和員工期望獲得的體驗產(chǎn)生重大影響。智言科技AI團隊對于自然語言處理技術(shù)以及知識圖譜技術(shù)在不斷地探索和研發(fā)。智言科技也希望通過搜索、推薦、語音及語義識別等人工智能算法,能夠滿足業(yè)務(wù)量快速增長的目標,助力企業(yè)完成在新的業(yè)務(wù)模式和傳統(tǒng)系統(tǒng)之間的平穩(wěn)過渡。
- 比亞迪海獅07DM-i:從入門即滿配,顛覆傳統(tǒng)駕享新選擇
- 零跑董事長回應(yīng)年薪傳聞:理性看待,真實分享
- 宇樹科技機器狗遭曝存在后門漏洞 公司回應(yīng):不實信息,將加強安全措施
- 思特威創(chuàng)新推出1200萬像素AI眼鏡視覺神器,開啟智能穿戴新紀元
- Imagination破局Edge AI與圖形處理:E-Series GPU重塑未來,實力詮釋想象之力
- OpenAI新任CEO:揭秘人工智能領(lǐng)域新變革
- 泡泡瑪特股價震蕩,投資者對盲盒經(jīng)濟降溫?
- 流量與商譽的較量:胖東來、抖音與柴懟懟的“玉石之戰(zhàn)”背后的商業(yè)角力
- 京東全球招募頂尖青年技術(shù)天才:打破薪酬上限,探索未來科技新紀元
- Meta內(nèi)部文件揭露:高管自曝TikTok讓Facebook顏面掃地,反思社交媒體市場敗退真相
免責聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準確性及可靠性,但不保證有關(guān)資料的準確性及可靠性,讀者在使用前請進一步核實,并對任何自主決定的行為負責。本網(wǎng)站對有關(guān)資料所引致的錯誤、不確或遺漏,概不負任何法律責任。任何單位或個人認為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權(quán)或存在不實內(nèi)容時,應(yīng)及時向本網(wǎng)站提出書面權(quán)利通知或不實情況說明,并提供身份證明、權(quán)屬證明及詳細侵權(quán)或不實情況證明。本網(wǎng)站在收到上述法律文件后,將會依法盡快聯(lián)系相關(guān)文章源頭核實,溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。