大模型再掀算力浪潮,曙光“ALL in”

伴隨8家大模型陸續(xù)通過《生成式人工智能服務管理暫行辦法》備案,文心一言率先向全社會全面開放,AIGC將真正迎來在國內實際落地開花的時期,“百模大戰(zhàn)”也將愈演愈烈。

ChatGPT帶動AIGC火爆的背后,人工智能算力需求也隨之暴漲。公開資料顯示,GPT-4的模型擁有近1.8萬億參數(shù)、13萬億訓練數(shù)據,其訓練一次的成本高達6300萬美元,大模型對算力的依賴顯而易見。除增加算力資源供給外,算力利用率優(yōu)化、使用門檻降低也至關重要。

無疑,實現(xiàn)算力、算法及應用的智能、協(xié)同調度,將算力更高效地轉化為生產力,成為制勝百模爭“算”時代的關鍵。

圖片1.png

作為全產業(yè)鏈覆蓋的核心信息基礎設施企業(yè),曙光對于大模型及大規(guī)模算力的支持與經驗,遠早于2023年。

近年來,基于對產業(yè)的深入洞察和前瞻預判,曙光在全國范圍內構建了包括智算中心、云中心、一體化大數(shù)據中心在內的各類算力中心,掌握了豐富多樣且通用性極強的算力資源。通過智能化調度和資源管理,將算力資源上云聯(lián)網,并以創(chuàng)新型算力服務平臺為出口,面向不同行業(yè)區(qū)域的用戶提供可便捷獲取的算力和應用。

截至目前,曙光已參與“悟道2.0”、“紫東太初”、“文心一言”、“通義千問”等多類大模型的訓練、微調、推理等工作,為其提供強勁算力支撐。累計完成30余個國內外主流大模型的適配孵化,包括業(yè)界熟知的GPT系列、LLaMA系列、GLM系列等。同等條件下,大模型訓練效率及訓練穩(wěn)定性都得到顯著提升。

此外,針對大模型訓練帶來的挑戰(zhàn),曙光緊密協(xié)同生態(tài)伙伴,與百度、阿里、智源研究院、智譜AI、復旦大學、之江實驗室、捷通華聲等業(yè)內領先企業(yè)及科研院所深度合作,充分調動起政、產、學、研、用各方力量,打造了面向不同應用場景的大模型一體機、大模型存儲解決方案等,提供從底層算力、框架、算法、應用等全棧AI能力,滿足多場景需求,加速大模型探索創(chuàng)新及產業(yè)化落地。

與此同時,由于大模型對算力的巨大需求,能耗問題日益嚴峻。自2011年開啟,曙光便致力于相關探索,研發(fā)了領先的浸沒式相變液冷技術和冷板式冷卻技術,構建了包含計算和存儲的全棧綠色計算方案,并已成功實現(xiàn)商業(yè)化部署。相比傳統(tǒng)風冷模式,在同等功率下,可為AI計算核心部件降溫20-30°C;在同等性能下,為算力設備降低能耗30%。目前,中國有超過58%的液冷數(shù)據中心選擇了曙光的技術方案。

信息產業(yè)在演變的每個階段,都會有主流的技術應用方向。在“萬變”的環(huán)境中,唯有把握前瞻趨勢、堅持打造核心競爭力才是應對變化的“不變”法則。無論是大模型,還是下一個新“風口”,曙光早已在等候。

(免責聲明:本網站內容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網站出現(xiàn)的信息,均僅供參考。本網站將盡力確保所提供信息的準確性及可靠性,但不保證有關資料的準確性及可靠性,讀者在使用前請進一步核實,并對任何自主決定的行為負責。本網站對有關資料所引致的錯誤、不確或遺漏,概不負任何法律責任。
任何單位或個人認為本網站中的網頁或鏈接內容可能涉嫌侵犯其知識產權或存在不實內容時,應及時向本網站提出書面權利通知或不實情況說明,并提供身份證明、權屬證明及詳細侵權或不實情況證明。本網站在收到上述法律文件后,將會依法盡快聯(lián)系相關文章源頭核實,溝通刪除相關內容或斷開相關鏈接。 )