5月6日,醫(yī)療大模型評測平臺MedBench發(fā)布新版評測榜單,潤達(dá)醫(yī)療與華為基于華為云盤古大模型創(chuàng)新研發(fā)的潤醫(yī)醫(yī)療大模型以92.9分在自測榜單中拔得頭籌,在專業(yè)評測榜單中以85.2分榮膺桂冠。潤醫(yī)醫(yī)療大模型在醫(yī)學(xué)語言理解、醫(yī)學(xué)安全和倫理等核心測評維度中表現(xiàn)突出。
最新版MedBench榜單(2025年2月版)
MedBench作為中文醫(yī)療大模型權(quán)威評測平臺,由上海人工智能實(shí)驗(yàn)室、上海市數(shù)字醫(yī)學(xué)創(chuàng)新中心聯(lián)合多家機(jī)構(gòu)打造,已成為全球醫(yī)療AI領(lǐng)域重要參照標(biāo)準(zhǔn)之一。目前,平臺已累計(jì)評測全球387個醫(yī)療大模型,從醫(yī)學(xué)語言理解、生成、知識問答、復(fù)雜推理及醫(yī)療安全倫理五大維度,提供客觀科學(xué)的性能評估。
潤醫(yī)醫(yī)療大模型能夠一舉斬獲雙料第一,甚至在自測榜單中,醫(yī)學(xué)語言理解、醫(yī)療安全和倫理維度分別斬獲122.1、103.1高分,及在專業(yè)評測榜中,醫(yī)學(xué)語言理解維度斬獲119.7高分,充分佐證了潤達(dá)醫(yī)療在醫(yī)療大模型研發(fā)領(lǐng)域深厚的技術(shù)積累與強(qiáng)大的創(chuàng)新硬實(shí)力。此外,在醫(yī)學(xué)復(fù)雜推理等高階復(fù)雜醫(yī)療場景中,模型也取得了領(lǐng)先的效果,凸顯了模型運(yùn)用醫(yī)學(xué)知識進(jìn)行復(fù)雜分析和嚴(yán)謹(jǐn)推理的能力,將在醫(yī)學(xué)輔助診療、提升醫(yī)療效率和準(zhǔn)確率等方面發(fā)揮重要作用。
多維能力突出 重構(gòu)人機(jī)協(xié)同范式
潤醫(yī)醫(yī)療大模型在華為云盤古大模型L0層的基礎(chǔ)上,訓(xùn)練使用了千億級高質(zhì)量的中英文醫(yī)學(xué)文獻(xiàn)、醫(yī)學(xué)指南、書籍,及千萬量級醫(yī)療健康檔案和知識圖譜等數(shù)據(jù),融合高質(zhì)量通用數(shù)據(jù),構(gòu)成了潤醫(yī)醫(yī)療大模型底座。
從技術(shù)特性來看,380億高參數(shù)量賦予模型強(qiáng)大的學(xué)習(xí)能力,使其能夠精準(zhǔn)捕捉醫(yī)療數(shù)據(jù)中的復(fù)雜模式與內(nèi)在關(guān)系,顯著提升語言理解和生成能力,足以勝任各類復(fù)雜醫(yī)療任務(wù)。而支持32k序列長度,則確保模型具備卓越的長文本處理能力,能夠充分理解上下文語義,極大增強(qiáng)對復(fù)雜醫(yī)療文本的分析解讀效能,可在多輪對話、復(fù)雜病例分析等應(yīng)用場景中優(yōu)勢明顯。作為大模型訓(xùn)練的核心要素,海量高質(zhì)量數(shù)據(jù)為模型提供了豐富且準(zhǔn)確的知識來源,可有效提升模型泛化能力,使其在各類實(shí)際醫(yī)療場景中能夠做出更精準(zhǔn)的判斷與決策。
基于模型底座,潤達(dá)醫(yī)療還創(chuàng)新研發(fā)了循證推理引擎,通過構(gòu)建“動態(tài)權(quán)重分配、證據(jù)鏈追溯與不確定性量化”的“三位一體”臨床決策系統(tǒng)。其中,動態(tài)權(quán)重分配確保了模型可實(shí)時聚焦關(guān)鍵醫(yī)學(xué)信息;證據(jù)鏈追溯則通過知識圖譜,能夠驗(yàn)證推理路徑;不確定性量化則對模糊信息進(jìn)行概率評估。三項(xiàng)創(chuàng)新機(jī)制的協(xié)同運(yùn)作,有效將模型幻覺率嚴(yán)格控制了在醫(yī)療級安全閾值內(nèi)。不僅如此,潤達(dá)醫(yī)療還打造具有雙向進(jìn)化機(jī)制的可信AI大腦,在服務(wù)醫(yī)生的過程中持續(xù)學(xué)習(xí)臨床反饋,反向優(yōu)化自身推理路徑,重構(gòu)人機(jī)協(xié)同范式,讓AI成為醫(yī)生智慧的延伸,更精準(zhǔn)地滿足醫(yī)生和患者的知識需求,真正成為醫(yī)療場景中可靠的智能助手。
得益于多項(xiàng)核心創(chuàng)新技術(shù)的有力支撐,潤醫(yī)醫(yī)療大模型在MedBench評測的多個維度中均展現(xiàn)卓越性能,尤其是語言理解與醫(yī)療安全和倫理維度。在醫(yī)學(xué)語言理解上,動態(tài)權(quán)重分配、證據(jù)鏈追溯與不確定性量化機(jī)制協(xié)同,可精準(zhǔn)捕捉文本關(guān)鍵信息與邏輯。而在醫(yī)療安全與倫理維度,“循證推理+可信AI”架構(gòu)深度剖析復(fù)雜場景,嚴(yán)格審查倫理風(fēng)險(xiǎn),為醫(yī)療質(zhì)效提升與合規(guī)安全筑牢雙重保障。
真實(shí)場景驗(yàn)證 賦能醫(yī)療質(zhì)效革新
從技術(shù)突破到民生福祉,潤達(dá)醫(yī)療基于大模型和數(shù)據(jù)治理的智慧醫(yī)療解決方案,貫穿“防-治-管”全流程,提供覆蓋疾病預(yù)防、診斷治療、患者管理的全生命周期服務(wù),已在智慧檢驗(yàn)、病情分析、病歷生成與質(zhì)控、區(qū)域健康管理等多維度真實(shí)醫(yī)療場景中完成實(shí)踐驗(yàn)證,成功實(shí)現(xiàn)智慧診療全場景落地應(yīng)用。
基于潤醫(yī)醫(yī)療大模型,潤達(dá)醫(yī)療與美年健康共同孵化的國內(nèi)首款A(yù)I私人健康管理師“健康小美”,截至今年3月底,其智能主檢應(yīng)用已在美年健康109家體檢中心上線應(yīng)用,且審核并生成超39萬份體檢報(bào)告,重點(diǎn)指標(biāo)精準(zhǔn)率90%+。
(免責(zé)聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請進(jìn)一步核實(shí),并對任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對有關(guān)資料所引致的錯誤、不確或遺漏,概不負(fù)任何法律責(zé)任。
任何單位或個人認(rèn)為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權(quán)或存在不實(shí)內(nèi)容時,應(yīng)及時向本網(wǎng)站提出書面權(quán)利通知或不實(shí)情況說明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實(shí)情況證明。本網(wǎng)站在收到上述法律文件后,將會依法盡快聯(lián)系相關(guān)文章源頭核實(shí),溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。 )