打破MLPerf基準測試16項AI性能紀錄 NVIDIA迎來AI全新里程碑

當前,AI芯片的功能日益復雜化、多樣化,一方面,芯片廠商紛紛給出不同的衡量標準,聲稱其產品在計算性能、單位能耗算力等方面處于行業(yè)領先水平;另一方面,用戶卻關心如何能從廠商給出的信息中判斷出芯片是否能實際滿足其真實場景的計算需求。

因此,成立于2018年5月的行業(yè)基準測試組織MLPerf推出了MLPerf基準測試,MLPerf基準測試是業(yè)內首套衡量機器學習軟硬件性能的通用基準,即訓練過的神經網絡在不同量級的設備(物聯(lián)網、智能手機、PC、服務器)、各種應用(自動駕駛、NLP、計算機視覺)上處理新數(shù)據(jù)的速度。MLPerf現(xiàn)有50多家成員,包括谷歌、微軟、Facebook、阿里巴巴等企業(yè),以及斯坦福、哈佛、多倫多大學等高校,并跟隨AI的發(fā)展步伐持續(xù)演進。

根據(jù)近日發(fā)布的MLPerf基準測試結果顯示,內置超過2000個NVIDIA A100 GPU的NVIDIA全新DGX SuperPOD在市售商用產品中脫穎而出,在各項針對大規(guī)模計算性能的MLPerf基準測試中均取得了優(yōu)異成績。此次已是NVIDIA在MLPerf訓練測試中連續(xù)第三次展現(xiàn)了最強勁的性能。2018年12月,NVIDIA首次在MLPerf訓練基準測試中創(chuàng)下了六項紀錄,次年7月NVIDIA再次創(chuàng)下八項紀錄。

NVIDIA在測試中用到的產品基于最新NVIDIA Ampere架構以及Volta架構。A100 Tensor Core GPU在加速器的全部八項MLPerf基準測試中展現(xiàn)了最快的性能。在實現(xiàn)總體最快的大規(guī)模解決方案方面,利用HDR InfiniBand實現(xiàn)多個DGX A100系統(tǒng)互聯(lián)的龐大集群——DGX SuperPOD系統(tǒng)在性能上,也開創(chuàng)了八項全新里程碑。

NVIDIA是唯一一家在所有測試中均采用市售商用產品的公司。其他大多數(shù)提交使用的要么是預覽類別(preview category),其所用的產品預計需要幾個月后才會面市,要么使用的是研究類別的產品,更是較長一段時間內都不會面市。

速度與規(guī)模兼得的DGX SuperPOD架構

NVIDIA在Selene上運行了系統(tǒng)的MLPerf測試,Selene是基于DGX SuperPOD的內部集群。DGX SuperPOD是針對大規(guī)模GPU集群的公共參考架構,NVIDIA DGX SuperPOD基于NVIDIA DGX A100系統(tǒng)。NVIDIA DGX A100在一臺6U服務器中集成了8顆A100 GPU以及NVIDIA Mellanox HDR InfiniBand網絡技術,可以為高性能計算、數(shù)據(jù)分析和AI工作(包括訓練和推理)等多種組合提供加速,并實現(xiàn)快速部署。

Selene最近在TOP500榜單中首次亮相,憑借百億億次(exaflops)級別的AI性能,成為美國最快的工業(yè)系統(tǒng)。它也是Green500榜單中全球第二大節(jié)能系統(tǒng)。除了出色的能效表現(xiàn),Selene的快速部署能力也是令人刮目相看。工程師們可以使用NVIDIA的模塊化參照架構,在不到四周的時間內就能快速構建Selene。4名操作人員僅需不到1個小時,就能組裝起一套由20臺系統(tǒng)組成的DGX A100集群,創(chuàng)建出一套性能可以達到2petaflops的系統(tǒng)。

目前,客戶已經采用這些參考架構來構建自身的DGX POD和DGX SuperPOD。其中包括美國最快的學術領域AI超級計算機HiPerGator,該超級計算機也將成為佛羅里達大學跨學科AI創(chuàng)新的基石。

同時,全球領先的超算中心Argonne國家實驗室正在使用DGX A100,尋找抗擊COVID-19疫情的方法。Argonne國家實驗室是六個首批采用A100 GPU的高性能計算中心中的先行者之一。

DGX SuperPOD現(xiàn)已助力汽車領域的大陸集團、航空航天領域的Lockheed Martin和云計算服務領域的微軟等公司取得了良好的業(yè)務成果。這些系統(tǒng)的順利運轉,部分得益于其廣泛的生態(tài)系統(tǒng)對于NVIDIA GPU和DGX支持。

123下一頁>

(免責聲明:本網站內容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網站出現(xiàn)的信息,均僅供參考。本網站將盡力確保所提供信息的準確性及可靠性,但不保證有關資料的準確性及可靠性,讀者在使用前請進一步核實,并對任何自主決定的行為負責。本網站對有關資料所引致的錯誤、不確或遺漏,概不負任何法律責任。
任何單位或個人認為本網站中的網頁或鏈接內容可能涉嫌侵犯其知識產權或存在不實內容時,應及時向本網站提出書面權利通知或不實情況說明,并提供身份證明、權屬證明及詳細侵權或不實情況證明。本網站在收到上述法律文件后,將會依法盡快聯(lián)系相關文章源頭核實,溝通刪除相關內容或斷開相關鏈接。 )

贊助商
2020-07-30
打破MLPerf基準測試16項AI性能紀錄 NVIDIA迎來AI全新里程碑
當前,AI芯片的功能日益復雜化、多樣化,一方面,芯片廠商紛紛給出不同的衡量標準,聲稱其產品在計算性能、單位能耗算力等方面處于行業(yè)領先水平;另一方面,用戶卻關心如何能從廠商給出的信息中判斷出芯片是否能實

長按掃碼 閱讀全文