北京時間5月21日消息(岳明)Light Reading在一篇最新報道中針對英偉達ARC-Compact的推出與潛在市場影響進行了分析。
盡管市場反響有限,英偉達仍未放棄向電信行業(yè)銷售AI芯片的嘗試。不過這家GPU巨頭似乎正在轉(zhuǎn)向中低端市場,并在最新推出的RAN解決方案中弱化了對AI的強調(diào)。如果說以著名計算機奇才兼海軍少將命名的Grace Hopper芯片組是一艘豪華超級游艇,那么近日發(fā)布的ARC-Compact則像是一艘配置簡化、功能精簡的經(jīng)濟型船只。
去年發(fā)布的搭載Grace Hopper及后續(xù)Grace Blackwell的ARC服務器主要面向部署集中式RAN(C-RAN)的電信運營商,旨在通過就近數(shù)據(jù)中心支撐多基站運行。而全新推出的ARC-Compact專為分布式RAN(D-RAN)基站部署設計,這一架構轉(zhuǎn)變將完全改變技術需求與經(jīng)濟模型。
圖:英偉達ARC-Compact產(chǎn)品圖。
ARC-Compact的核心組件是基于軟銀旗下Arm架構的Grace CPU及L4 Tensor Core GPU。相較于Hopper和Blackwell GPU,該解決方案更加輕量級,適用于一些邊緣視頻處理及推理任務,但無法勝任大語言模型訓練或高強度AI運算。
在官方技術博客中,英偉達將ARC-Compact描述為“高性價比、高能效”的解決方案,適用于“低時延AI工作負載與RAN加速”。但即便L4 Tensor Core的配置也可能超出實際需求。當前市場競爭有限,僅有三家RAN設備商可能采用該技術,且其關注重點更傾向于Grace CPU而非其他GPU。
CUDA架構推進遇阻
這三家設備商為愛立信、諾基亞與三星,它們均已對虛擬化RAN(vRAN)技術進行投資。該技術以通用CPU替代了5G網(wǎng)絡中常見的專用集成電路(ASIC)。英偉達提出的AI-RAN是這一概念的演進,它建議保留CPU用于處理計算強度較低的工作負載,同時引入GPU作為Layer 1的“內(nèi)聯(lián)”加速器——Layer 1在RAN軟件棧中屬于資源密集型部分。
當前的問題在于,上述三大設備商均未展現(xiàn)出采用英偉達統(tǒng)一計算設備架構(CUDA)來基于GPU進行RAN開發(fā)的強烈意愿。愛立信與三星更傾向于采用“旁路(lookaside)”vRAN架構,該方案為實現(xiàn)硬件獨立性,致力于最大限度將軟件保留在CPU運行。在現(xiàn)行部署中,僅Layer 1中的高負載任務——前向糾錯(FEC)需使用硬件加速器。
愛立信表示,在試驗環(huán)境中,其為英特爾x86架構CPU編寫的軟件經(jīng)少量修改即可移植至Grace平臺。這意味著即便最終采用GPU進行任何RAN計算,也僅用于FEC處理。三星同樣在Grace平臺進行軟件測試,并在最近明確表示不考慮采用Layer 1內(nèi)聯(lián)加速器?!爱擟PU無法提供足夠容量時,才需要內(nèi)聯(lián)加速器?!痹摴窘谕ㄟ^郵件向Light Reading表示,“隨著技術的進步,CPU已具備支持增強容量的能力,我們預計即使沒有內(nèi)聯(lián)加速器也可支持足夠的容量?!?/p>
諾基亞則另辟蹊徑,將vRAN資源集中投入內(nèi)聯(lián)架構。但其Layer 1加速器來自Marvell Technology而非英偉達,且該公司承認轉(zhuǎn)向CUDA架構需完全重寫代碼。諾基亞移動網(wǎng)絡業(yè)務集團負責人Tommi Uitto在今年3月MWC巴塞羅那期間表示,除非電信運營商采用GPU進行主流AI推理,否則幾乎沒有必要進行此類重構開發(fā)。
“在這種情況下,大部分計算將用于Layer 1之外的工作負載,那么使用Layer 1加速器也就無關緊要了?!彼敃r指出,“最終,我們希望在GPU中也實現(xiàn)Layer 1。”在此之前,諾基亞對英偉達技術的關注點更可能聚焦于將Grace用于Layer 1以上的功能模塊。
復蘇邊緣計算的設想
如果說將Grace Blackwell芯片作為AI推理的關鍵組件部署于電信數(shù)據(jù)中心已難以想象,那么ARC-Compact就更難扮演這一角色了。委婉而言,如今關于電信運營商可以從超大規(guī)模云服務商(hyperscaler)與其他數(shù)據(jù)中心企業(yè)服務不足的眾多地點提供AI 推理服務并實現(xiàn)盈利的構想近乎不切實際,這聽起來像是試圖重振邊緣計算的又一次嘗試。
甚至連電信運營商自身亦對此缺乏信心。Omdia近期開展了一項調(diào)查,詢問受訪者認為未來大多數(shù)AI處理將發(fā)生在何處。僅17%的受訪者回答是基站與樞紐站點,另有6%選擇了中心機房與前端站點。占比高達43%的最主流答案為終端用戶設備。電信運營商似乎處于終端設備與hyperscaler云服務之間的無人區(qū),他們相較于后者的唯一優(yōu)勢在于更低的網(wǎng)絡時延。
遺憾的是,對于一個中等規(guī)模的國家來說,那種需要大量站點才能支撐的超低時延服務需求幾乎為零。Omdia高級首席分析師Kerem Arsal在最近于倫敦舉行的一場活動上指出,AI-RAN方案的負面因素目前仍遠超其優(yōu)勢。“此外,hyperscaler對邊緣計算及合作伙伴關系的興趣有所消退,部分原因在于其商業(yè)模式未必會給邊緣計算帶來那么多回報?!彼治龇Q,電信運營商在邊緣計算方面迄今尚未展現(xiàn)“具有說服力的差異化價值”。
隨著業(yè)界對英特爾未來前景的疑慮升溫,Grace的出現(xiàn)顯得恰逢其時。此前,英特爾是vRAN CPU領域的唯一選擇。若RAN供應商能證明其軟件可近乎零修改地在x86與Arm架構之間進行遷移,則標志著其已實現(xiàn)底層硬件解耦。同時,CPU性能的持續(xù)提升對長期貶低其能力的廠商構成挑戰(zhàn)。英偉達CEO黃仁勛曾于去年9月表示:“CPU無法跟上ASIC的工作負載處理能力?!?/p>
Kerem Arsal指出:“AI處理架構可能從當前以GPU為核心的形態(tài)逐步向性能更強的CPU傾斜。此外,總體而言,模型輕量化趨勢顯著,設備自主處理關鍵AI工作復雜的可能性正在提升?!?這一趨勢顯然與黃仁勛的預期背道而馳。
- 搭載RTX 5060,華碩天選Air 2025高性能輕薄本首發(fā)價7099元起
- 英偉達AI-RAN最新動作:輕量化解決方案ARC-Compact登場
- 云革命:身份和訪問管理的創(chuàng)新與未來
- 從數(shù)據(jù)蔓延到精準:優(yōu)化云遷移,迎接人工智能驅(qū)動的未來
- 為什么減少延遲對于實時視覺智能系統(tǒng)至關重要
- AGI如何讓智慧城市更智慧?
- 超越超大規(guī)模:企業(yè)為何轉(zhuǎn)向其他云提供商
- 邁向智能化:自動化數(shù)據(jù)治理的創(chuàng)新與未來
- 中國移動全閃存存儲產(chǎn)品集采:華為等三家中標
- 全球禁用昇騰芯片!商務部回應:任何組織和個人執(zhí)行,須承擔相應法律責任
免責聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準確性及可靠性,但不保證有關資料的準確性及可靠性,讀者在使用前請進一步核實,并對任何自主決定的行為負責。本網(wǎng)站對有關資料所引致的錯誤、不確或遺漏,概不負任何法律責任。任何單位或個人認為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權或存在不實內(nèi)容時,應及時向本網(wǎng)站提出書面權利通知或不實情況說明,并提供身份證明、權屬證明及詳細侵權或不實情況證明。本網(wǎng)站在收到上述法律文件后,將會依法盡快聯(lián)系相關文章源頭核實,溝通刪除相關內(nèi)容或斷開相關鏈接。