華為云張平安:基于昇騰AI云服務(wù),可以打造出世界一流大模型

在6月20日的華為開發(fā)者大會(HDC 2025)上,華為常務(wù)董事、華為云計算 CEO張平安正式發(fā)布盤古大模型5.5,自然語言理解NLP、計算機(jī)視覺CV、預(yù)測、多模態(tài)、科學(xué)計算五大基礎(chǔ)模型全面升級,為行業(yè)提供全新價值。張平安強(qiáng)調(diào),盤古大模型是基于昇騰云的全棧軟硬件訓(xùn)練而成的,這標(biāo)志著基于昇騰架構(gòu)可以打造出世界一流大模型。

圖片3.jpg華為常務(wù)董事、華為云計算 CEO張平安正式發(fā)布盤古大模型5.5

在NLP大模型方面,全新的718B 深度思考模型是一個由256個專家組成的MoE大模型,在知識推理、工具調(diào)用、數(shù)學(xué)等領(lǐng)域大幅增強(qiáng),實現(xiàn)能力領(lǐng)先。盤古大模型通過通算掩蓋、全局動態(tài)均衡、分組混合專家MoGE等算法,實現(xiàn)了昇騰親和的高效訓(xùn)推系統(tǒng),訓(xùn)練MFU和單卡推理吞吐業(yè)界領(lǐng)先。同時,提出了模型親和的詞表、三明治架構(gòu)、EP-Group負(fù)載均衡loss等技術(shù),實現(xiàn)了不弱于業(yè)界一流模型的競爭力。

盤古大模型5.5在高效長序列、低幻覺、快慢思考融合、Agent等特性上進(jìn)行升級,提升用戶體驗。例如,盤古提出了自適應(yīng)快慢思考合一的技術(shù),通過構(gòu)建難度感知的快慢思考數(shù)據(jù)和兩階段漸進(jìn)訓(xùn)練,實現(xiàn)模型根據(jù)問題難易程度自適應(yīng)地切換快慢思考,簡單問題敏捷回復(fù),復(fù)雜問題深度思考,整體模型推理效率提升8倍。盤古深度研究DeepDiver通過長鏈難題合成、漸進(jìn)式獎勵等關(guān)鍵技術(shù),可以在網(wǎng)頁搜索、常識性問答等應(yīng)用上獲得很高的執(zhí)行效率,如可以在5分鐘內(nèi)完成超過10跳的復(fù)雜問答、生成萬字以上的專業(yè)調(diào)研報告等,大幅提升工作效率。

會上,張平安還分享了計算機(jī)視覺CV、預(yù)測、多模態(tài)、科學(xué)計算等基礎(chǔ)模型的技術(shù)升級,以及盤古大模型在農(nóng)業(yè)、工業(yè)、科研等領(lǐng)域的豐富創(chuàng)新應(yīng)用和落地實踐,持續(xù)深入行業(yè)解難題,成就行業(yè)AI先鋒。

(免責(zé)聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請進(jìn)一步核實,并對任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對有關(guān)資料所引致的錯誤、不確或遺漏,概不負(fù)任何法律責(zé)任。
任何單位或個人認(rèn)為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權(quán)或存在不實內(nèi)容時,應(yīng)及時向本網(wǎng)站提出書面權(quán)利通知或不實情況說明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實情況證明。本網(wǎng)站在收到上述法律文件后,將會依法盡快聯(lián)系相關(guān)文章源頭核實,溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。 )

贊助商
2025-06-20
華為云張平安:基于昇騰AI云服務(wù),可以打造出世界一流大模型
在6月20日的華為開發(fā)者大會(HDC 2025)上,華為常務(wù)董事、華為云計算 CEO張平安正式發(fā)布盤古大模型5.5

長按掃碼 閱讀全文