游戲市場(chǎng)正在不斷開(kāi)發(fā)出新的場(chǎng)景需求,游戲開(kāi)發(fā)團(tuán)隊(duì)在傳統(tǒng)業(yè)務(wù)之外也都在打磨新的工作流,來(lái)應(yīng)對(duì)高質(zhì)量的游戲制作任務(wù)和短平快的 AI 游戲。這不可避免地涉及到生產(chǎn)力工具 GPU 的升級(jí),而團(tuán)隊(duì)都希望“花小錢(qián),辦大事”,用一套高性?xún)r(jià)比的方案支撐起多元的應(yīng)用場(chǎng)景和不同的工作流。
但目前 GPU 架構(gòu)正在迭代,AI 工具、VR/AR 工具又以百花齊放的姿態(tài)不斷涌現(xiàn)出來(lái),對(duì)于游戲開(kāi)發(fā)團(tuán)隊(duì)做 GPU 采購(gòu)(一種中長(zhǎng)期的投資)也帶來(lái)了挑戰(zhàn)和壓力。我們特地根據(jù)不同的任務(wù)需求,整理了一些 GPU 選型的關(guān)鍵要素和項(xiàng)目測(cè)試數(shù)據(jù),給大家做個(gè)選型攻略分享。
1、3D圖形類(lèi)任務(wù)
任務(wù)涉及建模、材質(zhì)、燈光、動(dòng)畫(huà)、特效和渲染等。其中,渲染通常是性能要求最高的部分,我們可以根據(jù)開(kāi)發(fā)項(xiàng)目中的中大型場(chǎng)景渲染需求,初步框定顯卡選型的范圍。需要注意的是,很多 3D 軟件并不支持多 GPU 渲染,所以單張顯卡的能力非常關(guān)鍵。
【需要特別關(guān)注的顯卡參數(shù)】
顯存容量:
較大的顯存可以支持更復(fù)雜和更大規(guī)模的場(chǎng)景,顯存容量太小則會(huì)導(dǎo)致建模操作不暢、渲染錯(cuò)誤等情況。根據(jù)項(xiàng)目的測(cè)試情況來(lái)看,顯存 20GB 可以支持中型場(chǎng)景 4K 分辨率的渲染場(chǎng)景,如果是復(fù)雜場(chǎng)景 8K、16K 分辨率情況下,則需要顯存 32GB 以上。
GPU 架構(gòu)、CUDA 核心與 RT 核心:
目前大多數(shù)團(tuán)隊(duì)采用的是 NVIDIA Ampere 架構(gòu)、NVIDIA Ada Lovelace 架構(gòu)的 NVIDIA RTX? GPU。NVIDIA Ada 架構(gòu)相比 NVIDIA Ampere 架構(gòu)是更新一代的架構(gòu),性能更高。CUDA 核心數(shù)會(huì)影響并行計(jì)算能力,而 RT 核心則是專(zhuān)用于加速光線追蹤的核心,簡(jiǎn)而言之,沒(méi)有 RT 核心則不支持光線追蹤。
是否 CUDA 核心數(shù)和 RT 核心數(shù)越多,性能就越高?
這里我們不得不強(qiáng)調(diào),不同的 GPU 架構(gòu),采用的是不同代的核心,新一代的核心性能會(huì)比上一代的更強(qiáng)。如果在同一架構(gòu)下,CUDA 核心和 RT 核心數(shù)越多,顯卡性能會(huì)更高。但在不同架構(gòu)的顯卡中,就不能這么比較。
因此以目前的技術(shù)發(fā)展來(lái)說(shuō),建議直接采用 Ada 架構(gòu)的 NVIDIA RTX GPU 來(lái)做圖形渲染,這樣更好做后期擴(kuò)展。
圖形 API:
NVIDIA RTX 專(zhuān)業(yè)顯卡與消費(fèi)級(jí)顯卡使用的是不同的驅(qū)動(dòng)程序,NVIDIA RTX 專(zhuān)業(yè)顯卡的企業(yè)版驅(qū)動(dòng)程序對(duì)于OpenGL 的優(yōu)化明顯更好,這對(duì)于團(tuán)隊(duì)來(lái)說(shuō)也是必須要考量的因素之一,如果團(tuán)隊(duì)會(huì)需要執(zhí)行到復(fù)雜的 3D 模型和高精度 3D 場(chǎng)景的任務(wù)、VR/AR 沉浸式體驗(yàn)場(chǎng)景,對(duì)效率與穩(wěn)定性要求高的情況下,專(zhuān)業(yè)顯卡能夠承擔(dān)的任務(wù)顯然會(huì)更多。
顯卡選型渲染測(cè)試:
有條件的情況下,我們盡量在購(gòu)買(mǎi)前提前跑一跑項(xiàng)目測(cè)試,以匹配項(xiàng)目中可能遇到的一些特殊的需求。之前我們測(cè)試了市場(chǎng)上較為常用的 NVIDIA RTX 專(zhuān)業(yè)顯卡在一些中大型場(chǎng)景方面的跑分、渲染表現(xiàn),并且將 Ada 架構(gòu)與Ampere 架構(gòu)相應(yīng)的顯卡作為對(duì)比,測(cè)試結(jié)果給大家做個(gè)參考:
適配于復(fù)雜場(chǎng)景的顯卡對(duì)比:
顯卡型號(hào)和參數(shù):
*顯卡圖片來(lái)源于 NVIDIA
NVIDIA RTX A6000 顯卡作為 NVIDIA RTX 系列 Ampere 架構(gòu)中的“卡皇”,被大家所熟知。目前該型號(hào)已停產(chǎn)。過(guò)往的測(cè)試結(jié)果了解到,NVIDIA RTX 5000 Ada 基于 Ada 架構(gòu)的優(yōu)勢(shì),圖形性能與 AI 性能都超過(guò)了 NVIDIA RTX A6000。
測(cè)試數(shù)據(jù)-跑分對(duì)比:
測(cè)試數(shù)據(jù)-渲染能力對(duì)比:
適配于中型場(chǎng)景的顯卡對(duì)比:
顯卡型號(hào)和參數(shù):
*顯卡圖片來(lái)源于 NVIDIA
20GB 顯存可以滿(mǎn)足日常中型場(chǎng)景的要求,同時(shí)我們測(cè)試得出,NVIDIA RTX 4000 Ada 相比 NVIDIA RTX A4500 顯卡,性能上有所提升,同時(shí)單插槽卡的優(yōu)勢(shì)也非常大,對(duì)于我們后期機(jī)器的擴(kuò)容很有幫助,性?xún)r(jià)比更高。
測(cè)試數(shù)據(jù)-跑分對(duì)比:
測(cè)試數(shù)據(jù)-渲染能力對(duì)比:
2、AI 類(lèi)任務(wù)
任務(wù)通常涉及使用 AIGC 工具輔助生成角色、道具、場(chǎng)景等,同時(shí)訓(xùn)練自有模型和開(kāi)發(fā)數(shù)字人等交互式體驗(yàn),團(tuán)隊(duì)通常傾向于本地化部署模式,模型訓(xùn)練是算力性能要求較高的部分。
AI 任務(wù)測(cè)試參考:
擴(kuò)散模型訓(xùn)練與推理:對(duì)于 AIGC 生成任務(wù),多數(shù)團(tuán)隊(duì)采用 ComfyUI 來(lái)搭建工作流。我們以 Flux 模型訓(xùn)練為例,F(xiàn)lux.1 dev 的 Lora 訓(xùn)練中, 512*512 分辨率,bs為6時(shí),學(xué)習(xí)率0.00005,步數(shù)為3000時(shí),顯存已經(jīng)占用至29-30GB。而在FP16訓(xùn)練中,相同的參數(shù)下,顯存占用約35-38GB。模型推理需要的 GPU 顯存建議以 16GB 起步,否則隨著模型的迭代發(fā)展和 AIGC 需求的增長(zhǎng),可能無(wú)法支撐未來(lái)較大規(guī)模的任務(wù)。
數(shù)字人開(kāi)發(fā):數(shù)字人交互體驗(yàn)類(lèi)所涉及的工具鏈更為復(fù)雜。接入大語(yǔ)言模型做簡(jiǎn)單問(wèn)答是普遍需求,以接入DeepSeek 為例,簡(jiǎn)單對(duì)話場(chǎng)景的推理可選擇7B、14B模型,建議顯存 30GB 及以上;32B 模型推理則需要約 96GB顯存來(lái)保證推理效率。如果涉及3D數(shù)字人制作,我們以使用過(guò)的 NVIDIA Omniverse Audio2Face 為例,在保證數(shù)字人運(yùn)行流暢的情況下,需要 24GB 顯存以上的顯卡,才能達(dá)到 FPS 在30幀以上。
顯卡選型攻略:
就單卡來(lái)說(shuō),更高的顯存意味著可以承載更大規(guī)模的模型,對(duì)于 AIGC 任務(wù)來(lái)說(shuō),在生成速度、分辨率、反應(yīng)速度、生成質(zhì)量上的優(yōu)勢(shì)更加明顯。此外,Tensor Core、單精度浮點(diǎn)運(yùn)算性能也可以作為我們綜合考量顯卡 AI 能力的指標(biāo)。
在單卡無(wú)法承載任務(wù)、或者需要多卡來(lái)加速任務(wù)的時(shí)候,我們需要插入多卡進(jìn)行計(jì)算, 這時(shí)候卡間通信和功耗問(wèn)題是不能忽視的。AI 工作站搭載 NVIDIA RTX 專(zhuān)業(yè)顯卡的方案具備P2P能力,通信效率會(huì)更高,并且專(zhuān)業(yè)顯卡功耗更低,能適配更多的機(jī)型。
綜合我們之前的測(cè)試情況,AI 類(lèi)任務(wù)建議選擇的專(zhuān)業(yè)顯卡型號(hào)如下:
建議根據(jù)單卡能力、多卡運(yùn)行能力、成本和效率、擴(kuò)展性來(lái)綜合評(píng)估最終的方案。并在購(gòu)置之前,盡量提前能夠做些測(cè)試。
3、總結(jié)建議
開(kāi)發(fā)任務(wù)的規(guī)模如果涉及到高精度、大規(guī)模AI訓(xùn)練推理的需求,可以通過(guò)選擇購(gòu)置“多面手” 顯卡,譬如 NVIDIA RTX 5000 Ada 來(lái)做支撐,用武之地更多,性?xún)r(jià)比就更高。
而對(duì)于中小型的開(kāi)發(fā)項(xiàng)目,所涉及的精度和 AI 需求都不高,推薦前期采用 NVIDIA RTX 4000 Ada 這種單插槽顯卡,成本可控,穩(wěn)定性高,既能滿(mǎn)足日常的開(kāi)發(fā)需求,又容易在后期做擴(kuò)展。
篇幅有限,上述測(cè)試數(shù)據(jù)具體內(nèi)容及更多咨詢(xún)規(guī)劃類(lèi)問(wèn)題,均可點(diǎn)擊下方鏈接獲取。
顯卡測(cè)試申請(qǐng)及方案咨詢(xún)
https://rlzqlo1asm.feishu.cn/share/base/form/shrcnCbOVoltOXPQjFxveqrrIQb
*與NVIDIA產(chǎn)品相關(guān)的圖片或視頻(完整或部分)的版權(quán)均歸NVIDIA Corporation所有。
技術(shù)支持
(免責(zé)聲明:本網(wǎng)站內(nèi)容主要來(lái)自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請(qǐng)進(jìn)一步核實(shí),并對(duì)任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對(duì)有關(guān)資料所引致的錯(cuò)誤、不確或遺漏,概不負(fù)任何法律責(zé)任。
任何單位或個(gè)人認(rèn)為本網(wǎng)站中的網(wǎng)頁(yè)或鏈接內(nèi)容可能涉嫌侵犯其知識(shí)產(chǎn)權(quán)或存在不實(shí)內(nèi)容時(shí),應(yīng)及時(shí)向本網(wǎng)站提出書(shū)面權(quán)利通知或不實(shí)情況說(shuō)明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實(shí)情況證明。本網(wǎng)站在收到上述法律文件后,將會(huì)依法盡快聯(lián)系相關(guān)文章源頭核實(shí),溝通刪除相關(guān)內(nèi)容或斷開(kāi)相關(guān)鏈接。 )