如何發(fā)現(xiàn)并預(yù)防人工智能“幻覺”?
當不確定答案時,生成式人工智能會產(chǎn)生“幻覺”,從而編造錯誤的答案。 牛津大學(xué)的研究人員開發(fā)了一個統(tǒng)計模型來識別可能的人工智能“幻覺”。 該方法區(qū)分了人工智能在內(nèi)容和表達上的不確定性,提高了可靠性。
什么是人工智能幻覺?
人工智能幻覺是指人工智能系統(tǒng)在訓(xùn)練數(shù)據(jù)收集過程中,產(chǎn)生或推斷不存在的不正確信息的情況。
如果不解決人工智能幻覺問題,則可能導(dǎo)致傳播虛假信息和做出有偏見的判斷等問題,從而引發(fā)經(jīng)濟和安全問題。
如何發(fā)現(xiàn)人工智能“幻覺”?
當生成式人工智能不知道問題的答案時,就會發(fā)出“幻覺”。以下是如何發(fā)現(xiàn)的方法。
牛津大學(xué)的研究人員發(fā)明了一種新方法,幫助用戶判斷生成式人工智能何時會出現(xiàn)“幻覺”。當人工智能系統(tǒng)被提出一個它不知道答案的問題時,就會出現(xiàn)這種情況,導(dǎo)致它編造一個錯誤的答案。
好在,有一些技巧可以幫助我們在發(fā)生這種情況時,及時發(fā)現(xiàn)并徹底防止發(fā)生。
如何阻止人工智能幻覺?
牛津大學(xué)團隊的一項新研究建立了一個統(tǒng)計模型,該模型可以識別生成式人工智能聊天機器人提出的問題何時最有可能產(chǎn)生錯誤答案。
這對于生成式人工智能模型來說是一個真正的問題,因為它們交流方式的先進性意味著它們可以將虛假信息當作事實。今年2月ChatGPT因提供虛假答案而失控時就凸顯了這一點。
隨著各行各業(yè)越來越多的人開始使用人工智能工具來幫助學(xué)習(xí)、工作和日常生活,參與這項研究的人工智能專家呼吁人們,以更清晰的方式判斷人工智能何時在編造答案,特別是在涉及醫(yī)療保健和法律等嚴肅話題時。
牛津大學(xué)的研究人員聲稱,其研究可以分辨出模型是正確的還是編造出來的。
研究作者Sebastian Farquhar在接受采訪時表示:“LLM能夠用多種不同的方式來表達同一件事,這使得我們很難分辨出其何時對答案有把握,何時只是在編造一些東西。使用以前的方法,無法區(qū)分模型是不確定要說什么,還是不確定如何表達。但新方法克服了這個問題。”
然而,在消除人工智能模型可能犯的錯誤方面,還有更多的工作要做。
Sebastian Farquhar補充道:“語義不確定性有助于解決特定的可靠性問題,但這只是一部分。如果LLM不斷犯錯,這種新方法就無法發(fā)現(xiàn)這一點。人工智能最危險的失敗是,當系統(tǒng)出現(xiàn)錯誤卻自信而系統(tǒng)化的時候。
- 高原上架起“信息天路”:雪域與世界 心跳正同頻!
- 中國廣電楊旭:構(gòu)建以廣播機制為核心的新型廣電網(wǎng)絡(luò) 今年將在北京開展全網(wǎng)試驗試點
- 無人機如何實現(xiàn)空中物聯(lián)網(wǎng)
- 中國鐵塔邊利軍:依托“三張網(wǎng)”,打造低空經(jīng)濟創(chuàng)新策源地
- 中國聯(lián)通李福昌:從技術(shù)突破到生態(tài)構(gòu)建,積極引領(lǐng)6G發(fā)展
- 商業(yè)智能與生成式人工智能的結(jié)合:數(shù)據(jù)驅(qū)動決策的新時代
- 中國電信傅志仁:通感融合在5G-A開端,在6G發(fā)展
- 國科量子公開一項基于AI的量子通信優(yōu)化專利
- 數(shù)據(jù)治理在數(shù)字化增長中的關(guān)鍵作用
- 中國移動丁海煜:頻譜是低空信息基礎(chǔ)設(shè)施發(fā)展的基石
免責聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準確性及可靠性,但不保證有關(guān)資料的準確性及可靠性,讀者在使用前請進一步核實,并對任何自主決定的行為負責。本網(wǎng)站對有關(guān)資料所引致的錯誤、不確或遺漏,概不負任何法律責任。任何單位或個人認為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權(quán)或存在不實內(nèi)容時,應(yīng)及時向本網(wǎng)站提出書面權(quán)利通知或不實情況說明,并提供身份證明、權(quán)屬證明及詳細侵權(quán)或不實情況證明。本網(wǎng)站在收到上述法律文件后,將會依法盡快聯(lián)系相關(guān)文章源頭核實,溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。