Arm®今日宣布多項全新的戰(zhàn)略合作,繼續(xù)致力于推動人工智能(AI)的創(chuàng)新,并將AI的體驗變?yōu)楝F(xiàn)實。除了自身已能實現(xiàn)AI開發(fā)的技術平臺之外,Arm還與AMD、英特爾、Meta、微軟、NVIDIA和高通技術公司等領先的科技企業(yè)攜手合作,通過多項計劃,聚焦于先進AI能力的實現(xiàn),由此帶來更快響應、更加安全的用戶體驗。這些合作計劃將在所有計算進行之處,助力1500多萬名Arm開發(fā)者,構建其所需的基礎框架、技術和規(guī)范,帶來新一代的AI體驗。
Arm執(zhí)行副總裁兼首席架構師與院士Richard Grisenthwaite表示:“AI的廣泛應用依賴于軟、硬件創(chuàng)新的持續(xù)協(xié)同。小到邊緣側運行工作負載的小型傳感器,大到處理復雜工作負載以訓練大語言模型(LLM)的大型服務器,軟硬件的協(xié)同發(fā)展將在每個技術節(jié)點中,助力AI能力的提升。隨著整個生態(tài)系統(tǒng)不斷發(fā)掘AI的真正潛力,我們也將面臨安全性、可持續(xù)性和數(shù)據(jù)瓶頸等諸多挑戰(zhàn)。因此,繼續(xù)探索行業(yè)內的協(xié)作至關重要,為此,我們才能實現(xiàn)AI的規(guī)?;哟筮吘墏鹊耐评砟芰?。”
助力邊緣AI發(fā)展
當下生成式AI和LLM正成為人們關注的焦點,而鑒于在智能手機領域,70%的第三方AI應用都運行在Arm CPU上,Arm已引領邊緣AI長達多年。在探索如何以可持續(xù)的方式實現(xiàn)AI并高效傳輸數(shù)據(jù)的同時,行業(yè)也需要繼續(xù)發(fā)展以實現(xiàn)在邊緣側運行AI和機器學習(ML)模型,然而,開發(fā)者在此卻面臨著計算資源日益受限的難題,使這個任務的實現(xiàn)充滿了挑戰(zhàn)。
Arm正與NVIDIA展開合作,針對NVIDIA TAO進行適配。這是一套針對ArmEthos™-U NPU使用的低代碼開源AI工具包,有助于構建性能優(yōu)化的視覺AI模型,并將其部署于搭載Ethos-U的處理器上。NVIDIA TAO提供了一個易使用的界面,可在免費且開源的領先AI和ML框架——TensorFlow和PyTorch上進行構建工作,為開發(fā)者帶來輕松無縫的模型開發(fā)和部署環(huán)境,同時賦能邊緣設備實現(xiàn)更復雜的AI工作負載,提升AI體驗。
在所有設備與市場中推動神經網(wǎng)絡的應用
在邊緣側推進神經網(wǎng)絡的部署是實現(xiàn)AI可持續(xù)增長的重要一環(huán)。Arm攜手Meta,通過ExecuTorch,將PyTorch引入基于Arm架構的邊緣側移動和嵌入式平臺。ExecuTorch可助力開發(fā)者更輕松地在移動和邊緣設備上,部署先進的AI和ML工作負載所需的先進神經網(wǎng)絡。Arm與Meta的合作將確保通過PyTorch和ExecuTorch,開發(fā)者能在未來更輕松地開發(fā)和部署AI與ML模型。
與Meta的合作依托于Arm在Tensor運算符集架構(TOSA)方面的巨大投入,TOSA為AI和ML加速器提供了通用框架,并支持廣泛的深度神經網(wǎng)絡工作負載。在基于Arm架構的各種處理器和數(shù)十億的設備上,TOSA也將成為AI和ML的堅實基石。
推動產業(yè)規(guī)模化的AI
若要以相對低的成本實現(xiàn)AI規(guī)?;涞?,支持廣泛的數(shù)據(jù)格式至關重要。Arm一直在為諸多專注于AI工作負載的新型小數(shù)據(jù)類型提供支持。
去年,Arm、英特爾和NVIDIA聯(lián)合發(fā)布了新型8位浮點規(guī)范,即“FP8”。自此FP8格式發(fā)展迅猛,參與合作的企業(yè)已擴大至AMD、Arm、谷歌、英特爾、Meta和NVIDIA,并共同制定了正式的OCP 8位浮點規(guī)范(OFP8)。在最新的A-profile架構更新中,Arm添加了與該標準一致的OFP8,以助力其在行業(yè)內神經網(wǎng)絡中的快速普及。OFP8是交換8位數(shù)據(jù)格式,使軟件生態(tài)系統(tǒng)能夠輕松共享神經網(wǎng)絡模型,從而不斷提高數(shù)十億設備上的AI計算能力。
開放的標準對于推動AI生態(tài)系統(tǒng)的創(chuàng)新、一致性與互操作性至關重要。為繼續(xù)支持相關標準的行業(yè)協(xié)作,Arm于近日正式加入了MX聯(lián)盟,該聯(lián)盟旗下成員包括了AMD、Arm、英特爾、Meta、微軟、NVIDIA和高通技術公司。近期,MX聯(lián)盟針對名為微擴展的新技術,進行技術規(guī)范的合作。這項技術基于芯片設計領域多年的探索與研究,是一種用于AI應用的窄位(8位和8位以下)訓練與推理的精細擴展方法。該規(guī)范對窄位數(shù)據(jù)格式進行了標準化,以消除行業(yè)的碎片化,實現(xiàn)AI的規(guī)?;?。
秉承合作精神,MX聯(lián)盟通過開放計算項目OCP,以開放、免許可的形式發(fā)布了MX規(guī)范。OCP項目由超大規(guī)模數(shù)據(jù)中心運營商和計算基礎設施領域的其他行業(yè)參與者組成,旨在促進相關技術在業(yè)內的廣泛采用。這也體現(xiàn)了各方認識到在生態(tài)系統(tǒng)中對可擴展AI解決方案提供公平訪問的必要需求。
前所未有的AI創(chuàng)新
Arm已成為全球AI部署的基礎。Arm致力于為開發(fā)者提供構建先進、復雜的AI工作負載所需的技術,而上述的種種合作只是Arm眾多舉措中的一部分。從傳感器、智能手機和軟件定義汽車,到服務器和超級計算機,Arm將成為未來AI發(fā)展的基石。
(免責聲明:本網(wǎng)站內容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準確性及可靠性,但不保證有關資料的準確性及可靠性,讀者在使用前請進一步核實,并對任何自主決定的行為負責。本網(wǎng)站對有關資料所引致的錯誤、不確或遺漏,概不負任何法律責任。
任何單位或個人認為本網(wǎng)站中的網(wǎng)頁或鏈接內容可能涉嫌侵犯其知識產權或存在不實內容時,應及時向本網(wǎng)站提出書面權利通知或不實情況說明,并提供身份證明、權屬證明及詳細侵權或不實情況證明。本網(wǎng)站在收到上述法律文件后,將會依法盡快聯(lián)系相關文章源頭核實,溝通刪除相關內容或斷開相關鏈接。 )