今年年初,ChatGPT猶如一顆火種,激發(fā)了AI應(yīng)用的發(fā)展動(dòng)力,AI產(chǎn)業(yè)進(jìn)入發(fā)展的快車(chē)道。國(guó)內(nèi)的AI產(chǎn)業(yè)自然也乘勢(shì)而起,僅半年光景國(guó)內(nèi)就涌現(xiàn)出近百款A(yù)I大模型產(chǎn)品,由此進(jìn)入“百模大戰(zhàn)”的競(jìng)爭(zhēng)格局。
訓(xùn)練大模型需要以算力為基礎(chǔ),全球AI公司對(duì)NVIDIA 芯片追捧至極,GPU有價(jià)無(wú)市。近期新聞,NVIDIA H100已無(wú)存貨,就算現(xiàn)在訂購(gòu),也要等2024年Q1甚至Q2才能用上。據(jù)傳聞,百度、字節(jié)、阿里、騰訊等大型科技公司也向NVIDIA下了總計(jì)50億美元的A800等芯片訂單。
只不過(guò)有人企圖對(duì)國(guó)內(nèi)AI大模型發(fā)展加以干涉。美國(guó)《華爾街日?qǐng)?bào)》透露,由于擔(dān)心中國(guó)可能使用NVIDIA 和其他公司的人工智能芯片“進(jìn)行武器開(kāi)發(fā)和黑客攻擊”,美國(guó)政府考慮加碼計(jì)算芯片領(lǐng)域的制裁,限制NVIDIA公司向中國(guó)出口A800、H800芯片,一時(shí)間讓處于快速發(fā)展中國(guó)AI產(chǎn)業(yè),又一次籠罩于禁售陰影之下。
難以替代的GPGPU架構(gòu)芯片
從美國(guó)對(duì)國(guó)內(nèi)算力芯片的一而再,再而三地限制中,可以看到美國(guó)對(duì)中國(guó)AI產(chǎn)業(yè)發(fā)展的忌憚。近年來(lái)隨著數(shù)字經(jīng)濟(jì)的蓬勃發(fā)展,國(guó)內(nèi)在推進(jìn)算力基礎(chǔ)設(shè)施建設(shè)取得積極成效。據(jù)工信部統(tǒng)計(jì),目前我國(guó)算力總規(guī)模居全球第二,保持30%左右的年增長(zhǎng)率,而且新增算力設(shè)施中智能算力占比過(guò)半。這其中作為算力載體的AI計(jì)算芯片,其地位自然無(wú)比重要。
目前全球AI計(jì)算芯片主要分為GPGPU、ASIC、FPGA三種架構(gòu)。而被限制的A800和H800芯片就屬于GPGPU架構(gòu)芯片。GPGPU架構(gòu)也是AI加速芯片市場(chǎng)的主流,占據(jù)了90%的市場(chǎng)份額。
GPGPU從GPU發(fā)展而來(lái),是GPU去掉圖形處理能力,提升并行計(jì)算能力之后的產(chǎn)物。GPGPU是如何成為最適合AI計(jì)算的芯片呢?
對(duì)比CPU和GPU,結(jié)構(gòu)上的差異決定了CPU和GPU功能上的區(qū)別。由于CPU在控制和存儲(chǔ)的能力上比較強(qiáng),因此能進(jìn)行比較復(fù)雜的計(jì)算,不過(guò)可以同時(shí)執(zhí)行的線程很少。而GPU則相反,大量的計(jì)算單元讓它可以同時(shí)執(zhí)行多線程的任務(wù),但每一個(gè)任務(wù)都比較簡(jiǎn)單。
打個(gè)比方,如果CPU是一個(gè)懂高等數(shù)學(xué)的大學(xué)生,概率、微積分全都會(huì)做,但讓他做一萬(wàn)道四則運(yùn)算數(shù)學(xué)題,還是要花費(fèi)大量的時(shí)間;而GPU好像是一萬(wàn)名只懂得四則運(yùn)算的小學(xué)生,雖然不會(huì)函數(shù)、代數(shù)等高級(jí)知識(shí),但是遇到一萬(wàn)道四則運(yùn)算兩秒就能做完。
在AI神經(jīng)算法成熟后,業(yè)內(nèi)發(fā)現(xiàn)GPU的功能特性很適合進(jìn)行AI訓(xùn)練,因?yàn)樵谏疃葘W(xué)習(xí)模型中,最主要的運(yùn)算就是矩陣運(yùn)算和卷積,而這些運(yùn)算從根本上都可以分解為簡(jiǎn)單的加法和乘法。如此挖掘出了GPU在AI領(lǐng)域的應(yīng)用空間。2007年,英偉達(dá)提出了GPGPU,即通用GPU架構(gòu),將原本專(zhuān)用于圖形處理的GPU改造成了更適合AI運(yùn)算的GPGPU。
其實(shí)AI計(jì)算芯片除了GPGPU架構(gòu),還有ASIC、FPGA等架構(gòu)。只不過(guò)ASIC、FPGA芯片是結(jié)合某些計(jì)算場(chǎng)景需求的定制化產(chǎn)品,通用性不強(qiáng)。
GPGPU研發(fā)難度高,國(guó)產(chǎn)短板待補(bǔ)齊
在美國(guó)限制出口、國(guó)內(nèi)大模型急需GPU或GPGPU的時(shí)候,國(guó)內(nèi)真正能做GPGPU的廠家卻很少。因?yàn)镚PGPU芯片研發(fā)難度,比其他類(lèi)型的AI芯片要高出很多。
有業(yè)內(nèi)人士分析過(guò),GPGPU 芯片的團(tuán)隊(duì)大概需要1000 人左右,至少也要做兩年才能做出一顆芯片,這還只是推理芯片而已。如果要做大模型訓(xùn)推一體的大芯片,那么至少 3 年才能把一顆芯片做出來(lái)。這意味著,如果有國(guó)內(nèi)廠商能趕上今年大模型風(fēng)潮,至少需要從2020年就開(kāi)始布局研發(fā)設(shè)計(jì)。
并且GPGPU研發(fā)出來(lái)之后,決定其性能發(fā)揮上下限的,不止是架構(gòu)設(shè)計(jì)優(yōu)劣、制造工藝先進(jìn)與否等條件,還需要有軟件生態(tài)支持,還需要售后團(tuán)隊(duì)結(jié)合大模型情況調(diào)優(yōu)產(chǎn)品等等。
NVIDIA之所以能稱(chēng)霸AI芯片領(lǐng)域,在于其結(jié)合GPGPU架構(gòu)開(kāi)發(fā)了CUDA軟件平臺(tái),允許開(kāi)發(fā)者使用類(lèi)C語(yǔ)言編寫(xiě)GPU的并行計(jì)算代碼,并且提供了大量的庫(kù)函數(shù)和工具來(lái)幫助優(yōu)化GPU計(jì)算。NVIDIA運(yùn)營(yíng)CUDA已經(jīng)十余年時(shí)間,軟件生態(tài)才是NVIDIA真正的護(hù)城河。
國(guó)內(nèi)AI芯片面對(duì)NVIDIA先發(fā)優(yōu)勢(shì),如何把握住AI大模型帶來(lái)的GPGPU黃金機(jī)遇?
國(guó)產(chǎn)GPGPU殺出幾匹黑馬
當(dāng)前國(guó)內(nèi)AI芯片主要廠商包括華為、寒武紀(jì)、海光信息、遂原、壁仞、天數(shù)智芯等,此外龍芯也在布局。其中,發(fā)力GPGPU芯片的包括海光、壁仞科技、龍芯等等。
海光GPGPU架構(gòu)芯片深算一號(hào)在2018年啟動(dòng)研發(fā),于去年發(fā)布。據(jù)了解,海光深算一號(hào)性能優(yōu)異,對(duì)比NVIDIA A100及 AMD MI100發(fā)現(xiàn),在典型應(yīng)用場(chǎng)景下,深算一號(hào)指標(biāo)已經(jīng)達(dá)到國(guó)際上同類(lèi)型高端產(chǎn)品的水平。并且深算一號(hào)最大亮點(diǎn)在于,支持全部計(jì)算精度,在國(guó)產(chǎn)GPGPU中具備唯一性。在生態(tài)方面,海光深算一號(hào)可兼容類(lèi)CUDA環(huán)境,對(duì)于AI開(kāi)發(fā)者無(wú)需復(fù)雜適配,即可遷移到海光平臺(tái)。
如此以來(lái),在禁售陰影下,海光GPGPU產(chǎn)品可作為國(guó)外芯片最好平替。據(jù)海光披露,截止今年GPGPU產(chǎn)品已量產(chǎn)商業(yè)化應(yīng)用,規(guī)模達(dá)幾十萬(wàn)片,應(yīng)用領(lǐng)域涵蓋互聯(lián)網(wǎng)、能源等行業(yè)。
壁仞科技成立于2019年,在2022年發(fā)布了首款GPGPU芯片BR100系列,性能方面超越NVIDIA A100,今年發(fā)力目標(biāo)為量產(chǎn)上市。但業(yè)內(nèi)人士認(rèn)為,對(duì)于國(guó)內(nèi)初創(chuàng)GPGPU公司而言,軟件生態(tài)更為重要。目前國(guó)內(nèi)的初創(chuàng)公司雖然在細(xì)分領(lǐng)域上有一定的落地,而真正在大模型訓(xùn)練上能有實(shí)際應(yīng)用的幾乎沒(méi)有。
而龍芯暫無(wú)產(chǎn)品發(fā)布,目前進(jìn)展為已經(jīng)完成相關(guān)IP的設(shè)計(jì),正在驗(yàn)證優(yōu)化過(guò)程中,第一個(gè)集成自研GPGPU核的SOC芯片計(jì)劃于2024年Q1流片。從流片到量產(chǎn),如果按最快6-12個(gè)月來(lái)算,龍芯的GPGPU產(chǎn)品至少也要在2024年Q3以后才能發(fā)布,量產(chǎn)估計(jì)需要在2025年了。
總體而言,國(guó)產(chǎn)GPGPU邁出從0到1的第一步是最主要的。禁售危機(jī)中蘊(yùn)藏著機(jī)遇,哪怕作為后來(lái)者,在國(guó)內(nèi)如此大的消費(fèi)市場(chǎng)支撐下,也將有追趕上NVIDIA的可能。
- 超級(jí)以太網(wǎng)的興起:推動(dòng)下一代人工智能工作負(fù)載
- 2025年,人工智能如何革新家庭設(shè)計(jì)?
- 掌握超高密度布線:挑戰(zhàn)、風(fēng)險(xiǎn)和解決方案
- 人工智能如何重塑未來(lái)的工作?
- 千家早報(bào)|小米首個(gè)推理大模型開(kāi)源;到2030年,全球智能家居市場(chǎng)預(yù)計(jì)將達(dá)到5372.7億美元——2025年05月06日
- 【上周小結(jié)】APP停止放號(hào)背后:中國(guó)廣電如何破局5G用戶增長(zhǎng)困局?
- 咖香匯客 鐵塔有約 | 上海鐵塔助力2025上海國(guó)際咖啡文化節(jié)樂(lè)享“無(wú)界”
- WinWin高端訪談:菲律賓Smart以5G Max推動(dòng)體驗(yàn)進(jìn)化,重新定義5G價(jià)值邊界
- 到2029年,交通管理市場(chǎng)預(yù)計(jì)將達(dá)到757.4億美元
- 為什么核能可能是滿足人工智能日益增長(zhǎng)的電力需求的關(guān)鍵
免責(zé)聲明:本網(wǎng)站內(nèi)容主要來(lái)自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請(qǐng)進(jìn)一步核實(shí),并對(duì)任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對(duì)有關(guān)資料所引致的錯(cuò)誤、不確或遺漏,概不負(fù)任何法律責(zé)任。任何單位或個(gè)人認(rèn)為本網(wǎng)站中的網(wǎng)頁(yè)或鏈接內(nèi)容可能涉嫌侵犯其知識(shí)產(chǎn)權(quán)或存在不實(shí)內(nèi)容時(shí),應(yīng)及時(shí)向本網(wǎng)站提出書(shū)面權(quán)利通知或不實(shí)情況說(shuō)明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實(shí)情況證明。本網(wǎng)站在收到上述法律文件后,將會(huì)依法盡快聯(lián)系相關(guān)文章源頭核實(shí),溝通刪除相關(guān)內(nèi)容或斷開(kāi)相關(guān)鏈接。