在6月21日舉辦的華為開發(fā)者大會(HDC 2024)上,華為云CTO張宇昕介紹了下一代云基礎設施——CloudMatrix。這一創(chuàng)新性的技術解決方案旨在解決當前云平臺在大模型訓練和使用中遇到的“算力墻”“內(nèi)存墻”和“能效墻”等問題。
張宇昕表示,CloudMatrix改變了傳統(tǒng)數(shù)據(jù)中心的架構和算力供給模式,將傳統(tǒng)的以CPU為中心的主從架構,演進為多元算力對等全互聯(lián)架構;并通過高速互聯(lián)網(wǎng)絡協(xié)議,將CPU、NPU、GPU 等算力資源全部互聯(lián)和池化,從而把AI算力從單體算力演進到矩陣算力,開啟智能算力新紀元。
目前華為云是業(yè)界唯一采用對等架構超節(jié)點技術提供算力服務的廠商,實現(xiàn)了業(yè)界領先的性能和可靠性。據(jù)悉,華為云超節(jié)點在算力方面相比業(yè)界單節(jié)點提升了50倍,大模型的checkpoint恢復時長低于10分鐘,萬卡集群線性度大于95%,遠超業(yè)界水平。
值得一提的是,基于盤古大模型5.0的實測數(shù)據(jù)顯示,在同等算力條件下,CloudMatrix相較于傳統(tǒng)服務器集群架構,在模型訓練效率上提升了68%。這一顯著的提升,充分證明了CloudMatrix在云原生基礎設施方面的技術領先性。
(免責聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準確性及可靠性,但不保證有關資料的準確性及可靠性,讀者在使用前請進一步核實,并對任何自主決定的行為負責。本網(wǎng)站對有關資料所引致的錯誤、不確或遺漏,概不負任何法律責任。
任何單位或個人認為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權或存在不實內(nèi)容時,應及時向本網(wǎng)站提出書面權利通知或不實情況說明,并提供身份證明、權屬證明及詳細侵權或不實情況證明。本網(wǎng)站在收到上述法律文件后,將會依法盡快聯(lián)系相關文章源頭核實,溝通刪除相關內(nèi)容或斷開相關鏈接。 )