近日,云天勵(lì)飛在業(yè)績說明會(huì)上披露,公司下一代高性能推理芯片正按計(jì)劃研發(fā)中。目前公司企業(yè)級業(yè)務(wù)已經(jīng)積累了頭部互聯(lián)網(wǎng)大廠、龍頭硬件廠商等客戶及生態(tài)資源。后續(xù)公司將以自研芯片和核心模組等形式面向家庭主機(jī)、機(jī)器人、無人車、無人機(jī)、智慧交通邊緣加速計(jì)算等場景提供高能效、低功率和高實(shí)時(shí)性要求的算力,并尋求在使用量級上持續(xù)突破;另一方面,以AI推理加速卡、服務(wù)器整機(jī)、智算集群提供服務(wù)等形式,基于原有生態(tài)上持續(xù)擴(kuò)大在AI公司、互聯(lián)網(wǎng)廠商等的國產(chǎn)化AI算力機(jī)會(huì)。
在過去幾年,人工智能的發(fā)展主要集中在AI模型的訓(xùn)練上。深度學(xué)習(xí)算法的迭代和大模型的涌現(xiàn),均依賴于強(qiáng)大的計(jì)算資源以支持海量數(shù)據(jù)的學(xué)習(xí)與優(yōu)化。以英偉達(dá)為代表的芯片廠商憑借其在GPU領(lǐng)域的優(yōu)勢,在訓(xùn)練階段的市場中占據(jù)顯著地位。然而,隨著AI應(yīng)用場景的日益豐富和落地,AI推理的重要性逐漸提升。推理,即指將訓(xùn)練完成的AI模型部署到實(shí)際應(yīng)用中,進(jìn)行實(shí)時(shí)的數(shù)據(jù)處理和決策。例如,在自動(dòng)駕駛、機(jī)器人等交互等應(yīng)用中,對AI推理芯片的性能、能效和實(shí)時(shí)性均提出了特定要求。
當(dāng)前,AI應(yīng)用需求的增長正在推動(dòng)推理芯片市場的發(fā)展。從智能家居、機(jī)器人到無人機(jī)、無人車等終端設(shè)備,對本地化AI推理能力的需求日益增加,以支持設(shè)備自主運(yùn)行。同時(shí),隨著數(shù)據(jù)量的不斷增長,將所有數(shù)據(jù)傳輸至云端進(jìn)行處理的模式面臨效率和帶寬挑戰(zhàn),邊緣AI推理因此受到關(guān)注。它將AI算力下沉到數(shù)據(jù)源頭,有助于提升響應(yīng)速度并優(yōu)化數(shù)據(jù)處理。市場對輕量化、低功耗、高能效的AI芯片需求持續(xù)存在,這促使了各類AI加速卡、專用ASIC芯片等創(chuàng)新硬件產(chǎn)品的出現(xiàn),為不同應(yīng)用場景提供定制化的推理解決方案。在此背景下,AI推理芯片的市場規(guī)模預(yù)計(jì)將有所增長。
據(jù)悉,云天勵(lì)飛一直在大力投入AI推理芯片研發(fā),沉淀了11年的研發(fā)經(jīng)驗(yàn)。目前已開發(fā)出多款A(yù)I芯片,包括 DeepEdge10C、DeepEdge10標(biāo)準(zhǔn)版、DeepEdge10Max和DeepEdge200 等,并于2024年推出了大模型推理加速卡 IPU-X6000。
其中,DeepEdge10芯片是云天勵(lì)飛自主研發(fā)的AI推理高性能芯片,采用國產(chǎn)14nm Chiplet工藝,并內(nèi)置國產(chǎn)RISC-V核。該系列芯片基于“算力積木”AI芯片架構(gòu),能夠封裝成不同算力的芯片,覆蓋8T至256T的算力應(yīng)用,可支持包括Transformer模型、BEV模型、CV大模型、LLM大模型等各類主流模型的高效推理,并已完成DeepSeek 系列模型以及國產(chǎn)鴻蒙操作系統(tǒng)的適配。這些芯片已在機(jī)器人、邊緣網(wǎng)關(guān)、服務(wù)器等領(lǐng)域?qū)崿F(xiàn)商業(yè)化應(yīng)用。
值得一提的是,公司AI芯片還獲得工信部、科技部、發(fā)改委AI芯片專項(xiàng)“大滿貫”,并已通過國家科技部重大專項(xiàng)驗(yàn)收。
未來,云天勵(lì)飛將以NPU推理芯片為核心,涵蓋邊緣推理芯片與云端推理芯片,構(gòu)建起具備更高性價(jià)比的計(jì)算平臺(tái),并以此為基礎(chǔ)推進(jìn)大模型一體機(jī)、軟硬一體推理服務(wù)器等產(chǎn)品,以及相關(guān)服務(wù)及生態(tài)。
2025 年,公司將繼續(xù)加強(qiáng)神經(jīng)網(wǎng)絡(luò)處理器技術(shù)研發(fā),著重解決“卡脖子”技術(shù)攻關(guān),實(shí)現(xiàn)神經(jīng)網(wǎng)絡(luò)處理器芯片的自主可控;通過面向大模型的專用指令集、專用算子、專用的存算一體架構(gòu)、保證精度的低比特混合量化,實(shí)現(xiàn)算法與芯片的聯(lián)合深度優(yōu)化,滿足大模型的推理需求;開發(fā)包括芯片工具鏈、軟件開發(fā)包等組成的配套全棧軟件開發(fā)平臺(tái),為公司神經(jīng)網(wǎng)絡(luò)處理器生態(tài)化發(fā)展提供有力保障。
(免責(zé)聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請進(jìn)一步核實(shí),并對任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對有關(guān)資料所引致的錯(cuò)誤、不確或遺漏,概不負(fù)任何法律責(zé)任。
任何單位或個(gè)人認(rèn)為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權(quán)或存在不實(shí)內(nèi)容時(shí),應(yīng)及時(shí)向本網(wǎng)站提出書面權(quán)利通知或不實(shí)情況說明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實(shí)情況證明。本網(wǎng)站在收到上述法律文件后,將會(huì)依法盡快聯(lián)系相關(guān)文章源頭核實(shí),溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。 )