顫抖吧人類:AI開始給論文糾錯(cuò)了

AI工具狂掃論文錯(cuò)誤,黑塑料毒性風(fēng)波后,兩大項(xiàng)目崛起。雖助減肥假與錯(cuò),專家卻憂誤判傷人,未來是救星還是累贅?

去年末,全球媒體吵得沸沸揚(yáng)揚(yáng),說黑塑料廚具含致癌阻燃劑,風(fēng)險(xiǎn)超標(biāo)??蓻]多久就發(fā)現(xiàn),這不過是研究里一個(gè)數(shù)學(xué)失誤鬧的烏龍——關(guān)鍵化學(xué)物質(zhì)含量其實(shí)比安全線低十倍。眼尖的研究者立馬指出,人工智能(AI)幾秒鐘就能揪出這錯(cuò)。這事兒一出,立馬點(diǎn)燃了兩個(gè)用AI查科學(xué)文獻(xiàn)錯(cuò)誤的項(xiàng)目的熱情。

先說“黑鏟子項(xiàng)目”,這是個(gè)開源AI工具,已經(jīng)翻看了500多篇論文找茬。項(xiàng)目協(xié)調(diào)者、哥倫比亞卡塔赫納的獨(dú)立AI研究者 Joaquin Gulloso 說,他們有八個(gè)活躍開發(fā)者和幾百個(gè)志愿者顧問,眼下還沒公開錯(cuò)誤清單,而是私下聯(lián)系作者?!耙呀?jīng)逮住不少問題了,清單長得嚇人,簡直瘋了!” Gulloso 興奮地說。另一邊,“YesNoError”項(xiàng)目則野心更大。創(chuàng)始人 Matt Schlicht 是AI創(chuàng)業(yè)者,受“黑鏟子”啟發(fā),靠自創(chuàng)加密貨幣撐腰,想把所有論文掃一遍。他透露,兩個(gè)月內(nèi),他們的AI工具已經(jīng)檢查了37000多篇論文,網(wǎng)站上標(biāo)出有問題的文章,雖然很多還沒人工核實(shí),但他信心滿滿地說有大規(guī)模驗(yàn)證的計(jì)劃。

兩項(xiàng)目都希望研究者在投稿前用上這些工具,期刊出版前也來一輪檢查,目標(biāo)是把錯(cuò)誤和造假擋在科學(xué)文獻(xiàn)門外??蛇@事兒聽著美好,做起來卻沒那么簡單。

學(xué)術(shù)圈里那些專查研究誠信的“偵探”們對這倆項(xiàng)目有點(diǎn)看好,但也捏了把汗。荷蘭蒂爾堡大學(xué)的元科學(xué)學(xué)者 Michèle Nuijten 提醒,工具查錯(cuò)的本事和結(jié)果靠不靠譜,得說清楚?!叭f一指錯(cuò)了人,最后發(fā)現(xiàn)沒問題,那名譽(yù)可就毀了?!彼@話不無道理。瑞典林奈大學(xué)的法醫(yī)元科學(xué)家 James Heathers 也幫“黑鏟子”出過主意,他覺得現(xiàn)在胡亂發(fā)論文容易,想撤回來可難,AI先篩一遍再細(xì)查倒是個(gè)好開頭。“還早,但我挺支持的?!彼f。

其實(shí),盯著論文毛病的工具不算新鮮,可這回靠大型語言模型(LLM),查的范圍廣多了,從事實(shí)到計(jì)算、方法、引文,全都能掃。這些系統(tǒng)先把論文里的表格、圖片扒出來,再用一套復(fù)雜指令(叫“提示”)告訴“推理模型”——一種特別的LLM——要找啥錯(cuò)。有時(shí)一篇論文得掃好幾遍,要么查不同類型的錯(cuò),要么互相驗(yàn)證。分析一篇論文的成本從15美分到幾美元不等,看篇幅和指令復(fù)雜程度。

問題來了:AI也會看走眼。Gulloso 說,“黑鏟子”的系統(tǒng)目前錯(cuò)判率在10%左右,每條疑似錯(cuò)誤還得找專家復(fù)核,可找人成了最大瓶頸。項(xiàng)目創(chuàng)始人、軟件工程師 Steve Newman 直言,這是個(gè)大難題。YesNoError那邊,Schlicht 說他們從首批10000篇論文里挑了100個(gè)數(shù)學(xué)錯(cuò)誤驗(yàn)證,90%的作者回了信,幾乎都承認(rèn)AI找的錯(cuò)沒錯(cuò)。他們還打算跟 ResearchHub 合作,用加密貨幣雇博士科學(xué)家復(fù)核,可這計(jì)劃還沒啟動(dòng)。

然而,YesNoError網(wǎng)站上現(xiàn)在假陽性不少。林奈大學(xué)的誠信研究者 Nick Brown 隨便點(diǎn)了40篇標(biāo)紅的論文,發(fā)現(xiàn)14個(gè)是AI瞎報(bào)的,比如說文中提到的圖表不在論文里,其實(shí)就在那兒?!八麄冋业拇蠖嗍菍懽鲉栴},還老出錯(cuò)?!盉rown 有點(diǎn)擔(dān)心,這么下去會給科學(xué)圈添亂,凈忙著澄清小錯(cuò),像拼寫錯(cuò)誤這種,本該審稿時(shí)就抓住(兩項(xiàng)目主要看預(yù)印本論文)。“除非技術(shù)大跳躍,不然這是在瞎忙活,太天真了。”他說。

Schlicht 不服氣,反駁說他們正努力降假陽性?!靶″e(cuò)誤看著不重要,但就像黑廚具那篇,多一個(gè)零就能攪亂世界?!彼€說已經(jīng)跟學(xué)術(shù)圈的人聊上了,歡迎更多反饋。YesNoError還打算讓持幣者決定先查哪些論文,瞄準(zhǔn)公眾關(guān)注的熱點(diǎn),可 Brown 擔(dān)心這會瞄上氣候科學(xué)這種敏感領(lǐng)域。

如果真搞好了,Brown 覺得這些工具能揭開不少真相?!凹僭O(shè)有人真弄出個(gè)厲害的,某些領(lǐng)域就像開了燈的蟑螂窩,亂套了?!彼蛉さ馈O胂肽呛谒芰巷L(fēng)波,一個(gè)小錯(cuò)就能掀起軒然大波,AI查錯(cuò)這路還長著呢,到底是幫手還是添亂,誰心里也沒準(zhǔn)。

本文譯自 nature,由 BALI 編輯發(fā)布。

(免責(zé)聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請進(jìn)一步核實(shí),并對任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對有關(guān)資料所引致的錯(cuò)誤、不確或遺漏,概不負(fù)任何法律責(zé)任。
任何單位或個(gè)人認(rèn)為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權(quán)或存在不實(shí)內(nèi)容時(shí),應(yīng)及時(shí)向本網(wǎng)站提出書面權(quán)利通知或不實(shí)情況說明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實(shí)情況證明。本網(wǎng)站在收到上述法律文件后,將會依法盡快聯(lián)系相關(guān)文章源頭核實(shí),溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。 )

贊助商
1970-01-01
顫抖吧人類:AI開始給論文糾錯(cuò)了
AI工具狂掃論文錯(cuò)誤,黑塑料毒性風(fēng)波后,兩大項(xiàng)目崛起。雖助減肥假與錯(cuò),專家卻憂誤判傷人,未來是救星還是累贅?去年末,全球媒體吵得沸沸揚(yáng)揚(yáng),說黑塑料廚具含致癌阻燃劑,風(fēng)險(xiǎn)超標(biāo)。

長按掃碼 閱讀全文