新華三張鴻凌:多維技術創(chuàng)新深化端網協同構建開放多元智算生態(tài)

5月12日消息(苡臻)在AI熱潮席卷全球的當下,大模型參數規(guī)模正以驚人的速度突破萬億級大關。這不僅驅動著算法創(chuàng)新的狂飆,更引發(fā)了對AI基礎設施全面升級的迫切需求。業(yè)界掀起了大規(guī)模智算中心的建設浪潮,但多數目光聚焦于以GPU為代表的算力上,忽視了網絡聯接的價值。

作為網絡產業(yè)的領軍者,近日,新華三集團交換機產品線首席產品經理張鴻凌、新華三集團交換機產品管理部總監(jiān)陳伯超在接受C114采訪時指出,盡管網絡投資占比相對較小,但其對整體算力效能和經濟收益的影響至關重要,已成為推動智算中心升級的關鍵變量。相關數據顯示,網絡性能波動可導致訓練效率下降30%,訓練時長增加25%。

秉持“算力x聯接”理念,新華三集團通過多維度技術創(chuàng)新深化端網協同,為多元智算發(fā)展構建開放、高效、智能的聯接基礎,助力百行百業(yè)智能化轉型。從推出基于DDC(Diversity Dynamic-Connectivity,多元動態(tài)聯接)架構的新一代無損網絡解決方案,到傳統RoCE領域的創(chuàng)新布局,再到全場景定制化智算方案的打造,新華三正以全棧技術能力與開放生態(tài)思維,全方位賦能智算發(fā)展。

DDC多元+動態(tài)聯接:構建開放智算生態(tài)

當前,DeepSeek、Grok3等開源大模型的參數規(guī)模呈指數級躍升,其引發(fā)的算力集群通信壓力正突破傳統網絡架構極限。張鴻凌表示,開源戰(zhàn)略對網絡提出支持多元算力挑戰(zhàn),流量模型對網絡沖擊加劇,端網協同能力將成為關鍵支撐。

新華三集團交換機產品線首席產品經理張鴻凌

新華三集團推出基于DDC(Diversity Dynamic-Connectivity,多元動態(tài)聯接)架構的新一代無損網絡解決方案,面萬卡級算力互聯場景需求,重塑智算中心網絡架構。其聚焦“超大規(guī)模、極致性能、開放解耦、智能運維”四大技術突破,高效解決智算網絡中流量擁塞與調度難題,全面提升智算網絡效能。

張鴻凌介紹,DDC架構具備強大的多元算力承載能力,采用端到端調度機制,能根據網絡變化迅速、無感知切換,動態(tài)聯接適配能力出色,高度契合智算場景需求。實測數據顯示,基于DDC架構的組網方案相比傳統方案有效帶寬提升達107%,帶寬利用率可媲美InfiniBand網絡,且可靈活適配1K至70K節(jié)點的多樣化集群部署需求。

“對DDC架構的持續(xù)探索和升級,不僅代表了技術的革新,更是新華三對智算網絡范式的全新定義。其開放解耦的架構突破了傳統封閉系統的局限,支持多元算力生態(tài)的無縫接入,為AI產業(yè)提供可持續(xù)發(fā)展的聯接基礎?!睆堷櫫璞硎?。

在標準方面,新華三秉持開放共建的理念,攜手業(yè)界生態(tài)伙伴基于OSF(人工智能網絡開放調度架構)制定DDC核心框架標準,采用BGP協議發(fā)布隧道出口點(TEP),優(yōu)化AI網絡的流量調度能力,重點解決負載均衡、擁塞控制、網絡可靠性三大核心問題?!安煌O備只要遵循其標準即可實現互聯互通,突破傳統架構的束縛,構建開放智算生態(tài)。”陳伯超補充道。

多維度技術創(chuàng)新:端網協同破智算困局

除DDC架構外,新華三正以多點開花的探索實踐,編織更完善的智算網絡。張鴻凌提到,在傳統RoCE領域,新華三多方面創(chuàng)新布局。在國產算力生態(tài)方面,基于多元芯片路線打造包含AI服務器、RoCE交換機及存儲全生態(tài)的全國產化智算方案。

在端網流量有序協同方面,推出增強CBRC算法,并通過AD-DC智算版智能管控分析平臺實現對于智算網絡全生命周期運維管理。其核心理念是網絡與網卡協同,整合全局信息,進行統一調度,實現更好的流量均衡效果,提高訓練效率,減少通信擁塞,保障業(yè)務連續(xù)性,為智算網絡提供更穩(wěn)定、更智能、更高效的管理體驗。

在“算力x聯接”融合實踐方面,基于端網協同的智算方案,采用新華三全國產智算平臺,并結合AD-DC智算版,在實驗室進行了測試驗證。測試模型基于LIama370B,與傳統網絡相比,在All to All方面平均性能提升16%以上,效果跟IB網絡非常接近。

除了集群內的無損傳輸外,跨域算力流動同樣對網絡穩(wěn)定性提出更嚴苛挑戰(zhàn)。例如,長距傳輸延遲大、降速周期長導致業(yè)務易出現波動等。對此,新華三推出長距RDMA優(yōu)化方案,加速算力跨域流動。以交換機入口和出口處理為例,在Ingress方向建立RoCE會話流表,出現擁塞時代發(fā)擁塞通知報文(CNP);在Egress方向基于流表隊列深度檢測,發(fā)現擁塞事件觸發(fā)CNP發(fā)送。測試表明,在500QP場景下,響應時間可提高超80%,吞吐量提升超10%。代發(fā)CNP機制實現了降速周期縮短,快速避免擁塞,且接收端無感知,不影響整體業(yè)務的開展。

全場景賦能:提供定制化智算方案矩陣

在百行百業(yè)的智能化轉型進程中,應用場景的碎片化催生出對算力網絡的差異化訴求。從百卡到萬卡、從自建到租賃、從專業(yè)到入門,既要應對超大規(guī)模集群的精密調度,也要實現輕量化部署。這要求廠商具備全棧技術縱深與場景化橫向貫通的“柔性能力”。

張鴻凌表示,新華三擁有廣泛的客戶基礎,覆蓋數字政府、教育、企業(yè)、醫(yī)療、互聯網等多個行業(yè),客戶業(yè)務規(guī)模涵蓋小型、中型及超萬卡集群等大型組網場景。針對不同規(guī)??蛻?,新華三提供定制化解決方案:對于大規(guī)??蛻簦劳袕姶蟮木W元設備能力、優(yōu)化調優(yōu)技術及運維管理軟件,構建全流程管理機制與快速響應體系,助力高效運維,降低網絡中斷風險;對于小型客戶,則配備專業(yè)化整體解決方案及交付團隊,提供“交鑰匙”式全棧服務,實現一站式高效交付。

同時,根據客戶專業(yè)程度,新華三實現分級精準賦能。面向具備完整技術團隊的專業(yè)級客戶,提供網絡控制平臺與設備組合方案,實現網絡配置與業(yè)務系統的自動化對接,打造“無感化”網絡;對于擁有基礎運維能力的準專業(yè)級客戶,可在設備基礎上疊加算力調度平臺,實現算力與網絡資源協同管理;針對入門級客戶,提供分析器、基礎網管軟件及可選的智算版服務。除“自用型”客戶,針對租賃型業(yè)務客戶,新華三基于業(yè)務需求提供個性化網絡配置,實現靈活的租戶分配功能。

采訪最后,張鴻凌表示,新華三會繼續(xù)深耕全域智算產品研發(fā),堅持多元芯片戰(zhàn)略,致力于建設開放標準,為行業(yè)的智能演進構筑基石。未來,新華三將持續(xù)推動智算網絡技術創(chuàng)新,加速AI賦能各行各業(yè)。

不難看出,當網絡從數據通道蛻變?yōu)橄到y級調度中樞,端網協同成為解鎖AI生產力的關鍵。新華三正以開放思維,憑借一系列技術創(chuàng)新與解決方案,不斷踐行著“算力x 聯接”理念。不僅突破了傳統技術局限,更構建起開放多元的智算生態(tài),為百行百業(yè)的智能化轉型鋪就一條“無擁塞、無損耗”的智算高速路。

免責聲明:本網站內容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網站出現的信息,均僅供參考。本網站將盡力確保所提供信息的準確性及可靠性,但不保證有關資料的準確性及可靠性,讀者在使用前請進一步核實,并對任何自主決定的行為負責。本網站對有關資料所引致的錯誤、不確或遺漏,概不負任何法律責任。任何單位或個人認為本網站中的網頁或鏈接內容可能涉嫌侵犯其知識產權或存在不實內容時,應及時向本網站提出書面權利通知或不實情況說明,并提供身份證明、權屬證明及詳細侵權或不實情況證明。本網站在收到上述法律文件后,將會依法盡快聯系相關文章源頭核實,溝通刪除相關內容或斷開相關鏈接。

2025-05-13
新華三張鴻凌:多維技術創(chuàng)新深化端網協同構建開放多元智算生態(tài)
新華三張鴻凌:多維技術創(chuàng)新深化端網協同構建開放多元智算生態(tài),C114訊 5月12日消息(苡臻)在AI熱潮席卷全球的當下,大模型參數規(guī)模正以驚人的速度突破萬億級大

長按掃碼 閱讀全文