日前,由工業(yè)和信息化部、寧夏回族自治區(qū)人民政府共同舉辦的2023中國算力大會在銀川舉行。會上公布了算力領(lǐng)域最具影響力專家學(xué)者共同評選出的算力中國·年度突破成果,阿里云“PAI靈駿智算服務(wù)”作為國內(nèi)AI智算基礎(chǔ)設(shè)施代表獲評此項重要榮譽。
該評選為攻堅算力領(lǐng)域中的熱點、難點和關(guān)鍵問題設(shè)立,秉承“開創(chuàng)性、引領(lǐng)性、權(quán)威性、公平性”原則,旨在發(fā)掘在算力或相關(guān)產(chǎn)業(yè)達(dá)到全球領(lǐng)先水平的基礎(chǔ)理論、創(chuàng)新方法、方法模式和平臺應(yīng)用的創(chuàng)新成果。評審委員會由中國科學(xué)院院士、中國工程院院士、知名高校及科研機構(gòu)專家、領(lǐng)軍企業(yè)技術(shù)帶頭人組成,集聚中國算力相關(guān)領(lǐng)域最具影響力的專家學(xué)者。
“PAI靈駿智算服務(wù)”是阿里云面向高速增長的AI計算需求打造的算力基礎(chǔ)設(shè)施服務(wù),可一站式為企業(yè)及開發(fā)者提供AI開發(fā)全流程的工程平臺和智能算力。它具有超大并行計算規(guī)模、高性能、高效率、高利用率等特點,具備高達(dá)10萬卡量級的集群可擴展規(guī)模,能支撐多個萬億參數(shù)大模型同時訓(xùn)練,其中單訓(xùn)練任務(wù)可達(dá)萬卡規(guī)模,千卡規(guī)模的線性擴展效率達(dá)92%。
在此前實踐錘煉中,PAI靈駿智算服務(wù)穩(wěn)定支撐了10萬億參數(shù)多模態(tài)大模型的低能耗訓(xùn)練,在通義千問等大模型的訓(xùn)練和應(yīng)用中,將大模型訓(xùn)練效率顯著提高近 10 倍,推理效率提升2倍以上。
該評選認(rèn)為,阿里云PAI靈駿智算服務(wù)“以高性能網(wǎng)絡(luò)、高性能文件存儲、高穩(wěn)定性、極致軟硬件聯(lián)合優(yōu)化能力和serverless化服務(wù)能力,為大模型研究、AI for Science、AIGC等場景提供堅實支撐”。
PAI靈駿智算服務(wù)在多個核心技術(shù)領(lǐng)域具備領(lǐng)先性和創(chuàng)新性。動輒上千億參數(shù)的大模型訓(xùn)練,并非靠簡單“堆顯卡”就能完成,而是囊括底層算力、網(wǎng)絡(luò)、存儲、數(shù)據(jù)計算、AI框架等復(fù)雜技術(shù)的系統(tǒng)性工程。除了要通過精巧的設(shè)計實現(xiàn)超大計算工程落地外,還要做到“又快又省”,“榨干每一滴算力性能”。
在IaaS基礎(chǔ)設(shè)施層,阿里云打造了智能計算集群靈駿,通過端網(wǎng)一體、軟硬融合的可預(yù)期網(wǎng)絡(luò)技術(shù)對集群計算資源進(jìn)行統(tǒng)籌和優(yōu)化,實現(xiàn)芯片間微秒級穩(wěn)定互聯(lián)和高效并行計算。相關(guān)技術(shù)創(chuàng)新大幅消除了AI算力拓展性瓶頸,靈駿集群規(guī)模最大可拓展至“10萬卡級”,能為大模型的開發(fā)和應(yīng)用提供靈活多尺度的智能算力,對上層平臺應(yīng)用提供便捷的容器化服務(wù)。
在PaaS平臺服務(wù)層,阿里云機器學(xué)習(xí)平臺PAI可對龐大訓(xùn)練任務(wù)進(jìn)行自動分拆和分配,通過硬件、網(wǎng)絡(luò)、框架一體化協(xié)同調(diào)度能力,提供速度最快、算力最省的高性能分布式訓(xùn)練方案。同時,PAI配置了自動容錯訓(xùn)練框架AIMaster,在大語言模型動輒數(shù)周、數(shù)月的訓(xùn)練周期中,提供極致的穩(wěn)定性保障,減少人工介入成本,可將大模型訓(xùn)練時間縮短10倍。此外,PAI提供簡單易用的RLHF強化學(xué)習(xí)框架,能大幅提升大語言模型效果表現(xiàn)。
PAI靈駿智算服務(wù)還推出了國內(nèi)首個serverless化智算服務(wù)模式,提供一鍵開通、按需分配、極簡運維的用戶體驗,支持AI計算資源靈活復(fù)用,可大幅提升集群利用率,降低客戶的使用成本。
據(jù)了解,阿里云PAI靈駿智算服務(wù)已被眾多企業(yè)及科研單位應(yīng)用。阿里云與小鵬汽車合建的智算中心“扶搖”成為國內(nèi)最大的自動駕駛智算中心,將小鵬汽車自動駕駛模型訓(xùn)練速度提升170倍以上。阿里云與復(fù)旦大學(xué)共同打造的云上智算平臺CFFF,近期發(fā)布了45億參數(shù)量的中短期天氣預(yù)報大模型,將預(yù)測速度從原來的小時級縮短到了3秒內(nèi)。
- 2024年第四季度中國大陸云服務(wù)支出達(dá)到111億美元,阿里華為騰訊居前三
- 華為張修征:發(fā)揮“大雜燴”優(yōu)勢,四個方面投入推動AI應(yīng)用落地
- 華為云重磅發(fā)布CloudMatrix 384超節(jié)點,多項性能全面突破
- 鯤鵬開源開放創(chuàng)新成效卓著,計算產(chǎn)業(yè)革新行勝于言
- 浪潮云“分布式智能云”戰(zhàn)略正式發(fā)布 目標(biāo)年內(nèi)分布式智能云節(jié)點破千個
- IDC:2025年亞太地區(qū)云支出將達(dá)到2500億美元
- 亞馬遜云科技在Amazon Bedrock提供完全托管的DeepSeek-R1模型
- 正受科技與IBM攜手合作,共推制造業(yè)數(shù)智化轉(zhuǎn)型
- 世界第一!阿里云PolarDB登頂全球數(shù)據(jù)庫性能及性價比排行榜
- 阿里官宣巨投3800億:云與AI硬件基礎(chǔ)設(shè)施加速構(gòu)建,人形伴侶機器人賽道迎新機遇?
免責(zé)聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請進(jìn)一步核實,并對任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對有關(guān)資料所引致的錯誤、不確或遺漏,概不負(fù)任何法律責(zé)任。任何單位或個人認(rèn)為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權(quán)或存在不實內(nèi)容時,應(yīng)及時向本網(wǎng)站提出書面權(quán)利通知或不實情況說明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實情況證明。本網(wǎng)站在收到上述法律文件后,將會依法盡快聯(lián)系相關(guān)文章源頭核實,溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。