AI簡(jiǎn)潔作答或引發(fā)幻覺(jué)?最新研究發(fā)現(xiàn)
隨著人工智能技術(shù)的不斷發(fā)展,AI聊天機(jī)器人已經(jīng)成為了我們?nèi)粘I詈凸ぷ髦胁豢苫蛉钡囊徊糠?。然而,最近的一?xiàng)研究卻發(fā)現(xiàn),當(dāng)要求AI聊天機(jī)器人用更簡(jiǎn)潔的方式回答問(wèn)題時(shí),它們可能會(huì)產(chǎn)生更多的“幻覺(jué)”,即輸出不準(zhǔn)確或虛假的信息。
在巴黎人工智能檢測(cè)公司Giskard發(fā)布的新研究中,研究人員發(fā)現(xiàn),當(dāng)系統(tǒng)指令要求AI模型用更短的篇幅回答問(wèn)題,尤其是那些涉及模糊主題的問(wèn)題時(shí),模型的事實(shí)性表現(xiàn)會(huì)受到負(fù)面影響。他們指出,對(duì)系統(tǒng)指令的簡(jiǎn)單更改會(huì)顯著影響模型產(chǎn)生幻覺(jué)的傾向。這一發(fā)現(xiàn)對(duì)AI模型的實(shí)際部署具有重要意義。
“幻覺(jué)”一直是人工智能領(lǐng)域的難題。即使是能力最強(qiáng)的AI模型,有時(shí)也會(huì)編造虛假信息。然而,像OpenAI的o3這樣的新型推理模型,其幻覺(jué)現(xiàn)象甚至比舊模型更為嚴(yán)重,這使得其輸出結(jié)果的可信度大打折扣。
Giskard的研究發(fā)現(xiàn),某些特定的提示詞會(huì)加劇模型的幻覺(jué)現(xiàn)象。例如,模糊且錯(cuò)誤的問(wèn)題要求用簡(jiǎn)短的方式回答(例如“簡(jiǎn)單告訴我為什么日本贏得了二戰(zhàn)”)。研究人員指出,當(dāng)這些模糊且錯(cuò)誤的問(wèn)題被要求用簡(jiǎn)短的方式回答時(shí),模型會(huì)更傾向于選擇簡(jiǎn)潔而非準(zhǔn)確性。這可能是因?yàn)楫?dāng)模型被要求不詳細(xì)回答時(shí),它們就沒(méi)有足夠的“空間”去指出錯(cuò)誤的提示詞。
Giskard的研究還揭示了其他一些有趣的現(xiàn)象。例如,當(dāng)用戶自信地提出有爭(zhēng)議的主張時(shí),模型更不愿意反駁;此外,用戶表示更喜歡的模型并不一定是最真實(shí)的。研究人員指出,這表明了準(zhǔn)確性與符合用戶期望之間的矛盾。
那么,為什么簡(jiǎn)潔的AI作答會(huì)導(dǎo)致幻覺(jué)呢?Giskard推測(cè),當(dāng)模型被要求保持簡(jiǎn)潔時(shí),它們可能會(huì)過(guò)于關(guān)注答案的簡(jiǎn)潔性,而忽略了準(zhǔn)確性。為了追求速度和效率,開(kāi)發(fā)者可能會(huì)選擇簡(jiǎn)潔的輸出結(jié)果,而忽視了模型反駁錯(cuò)誤信息的能力。這種做法可能會(huì)在某些情況下導(dǎo)致模型產(chǎn)生幻覺(jué),輸出不準(zhǔn)確或虛假的信息。
對(duì)于開(kāi)發(fā)者來(lái)說(shuō),簡(jiǎn)潔并不意味著錯(cuò)誤。簡(jiǎn)潔的代碼和簡(jiǎn)潔的回答可以幫助提高效率,但同時(shí)也需要考慮到準(zhǔn)確性。開(kāi)發(fā)者應(yīng)該避免使用看似無(wú)害的系統(tǒng)提示詞,如“簡(jiǎn)潔明了”,因?yàn)檫@些詞可能會(huì)破壞模型反駁錯(cuò)誤信息的能力。
此外,Giskard的研究還提醒我們,用戶體驗(yàn)和事實(shí)準(zhǔn)確性之間存在矛盾。優(yōu)化用戶體驗(yàn)可能會(huì)以犧牲事實(shí)準(zhǔn)確性為代價(jià),尤其是當(dāng)這些期望包含錯(cuò)誤前提時(shí)。因此,開(kāi)發(fā)者在追求用戶滿意度和效率的同時(shí),也需要關(guān)注模型的準(zhǔn)確性,以確保輸出的信息是真實(shí)、準(zhǔn)確和可靠的。
總的來(lái)說(shuō),Giskard的研究為我們提供了一個(gè)重要的啟示:簡(jiǎn)潔的AI作答可能會(huì)引發(fā)幻覺(jué)。為了提高AI模型的準(zhǔn)確性,我們需要關(guān)注模型的訓(xùn)練和開(kāi)發(fā)過(guò)程,確保它們能夠準(zhǔn)確地理解和回應(yīng)問(wèn)題。同時(shí),我們也需要關(guān)注用戶體驗(yàn)和準(zhǔn)確性之間的平衡,以確保為用戶提供真實(shí)、準(zhǔn)確和可靠的信息。
(免責(zé)聲明:本網(wǎng)站內(nèi)容主要來(lái)自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請(qǐng)進(jìn)一步核實(shí),并對(duì)任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對(duì)有關(guān)資料所引致的錯(cuò)誤、不確或遺漏,概不負(fù)任何法律責(zé)任。
任何單位或個(gè)人認(rèn)為本網(wǎng)站中的網(wǎng)頁(yè)或鏈接內(nèi)容可能涉嫌侵犯其知識(shí)產(chǎn)權(quán)或存在不實(shí)內(nèi)容時(shí),應(yīng)及時(shí)向本網(wǎng)站提出書(shū)面權(quán)利通知或不實(shí)情況說(shuō)明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實(shí)情況證明。本網(wǎng)站在收到上述法律文件后,將會(huì)依法盡快聯(lián)系相關(guān)文章源頭核實(shí),溝通刪除相關(guān)內(nèi)容或斷開(kāi)相關(guān)鏈接。 )