Gitee AI 剛剛上線了DeepSeek-R1-Distill-Qwen-1.5B、DeepSeek-R1-Distill-Qwen-7B、DeepSeek-R1-Distill-Qwen-14B、DeepSeek-R1-Distill-Qwen-32B四個較小尺寸的 DeepSeek 模型。值得關注的是,本次上線的四個模型均部署在國產沐曦曦云 GPU 上。
與全尺寸 DeepSeek 模型相比,較小尺寸的 DeepSeek 蒸餾版本模型更適合企業(yè)內部實施部署,可以極大的降低落地成本。
同時,這次Deepseek R1 模型 + 沐曦曦云 GPU + Gitee AI 平臺,更是實現了從芯片到平臺,從算力到模型,全國產研發(fā)、中國制造。
100%國產AI的力量
國產模型 DeepSeek R1
DeepSeek R1 是一款大型混合專家(MoE)模型,擁有 6710 億個參數,支持 128000 個 Token 的大輸入上下文長度。在數學、代碼和自然語言推理等任務上表現出色。
本次部署在沐曦曦云 GPU 上的是四個 DeepSeek R1 蒸餾模型,以更小參數量的資源占用,實現了性能與大參數模型旗鼓相當。
國產 GPU 沐曦曦云
曦云系列通用 GPU 產品(包括 C550、C500、C500X、C290、C280、N260 等型號)采用完全自主研發(fā)的 GPU IP,擁有完整的知識產權,并具備強大的多精度混合計算能力及高帶寬顯存支持。同時,沐曦產品搭載先進的時空互聯技術和全球兼容的 MXMACA 軟件棧,可廣泛應用于智能、通用計算和數據處理等場景。
在本次部署適配工作中,得益于沐曦曦云良好的 CUDA 兼容性,同時得到沐曦的算力供應商超訊通信的鼎力支持,最終實現了模型的快速部署、穩(wěn)定調用。
國產平臺 Gitee AI
2024 年初上線以來,Gitee AI 平臺以 Serverless API、模型引擎、AI 應用為核心功能與服務,致力于讓開發(fā)者輕松構建和部署 AI 應用,為企業(yè)客戶提供更加智能、高效的 AI 應用解決方案。
100%國產AI免費跑
目前 Gitee AI 上的DeepSeek-R1-Distill系列模型現已面向全體開發(fā)者免費使用!免費使用!免費使用!
本次上線的模型參數雖小,但它們表現并不亞于大參數模型,如下圖中的DeepSeek-R1-Distill-Qwen-14B,雖然參數較小,但簡單任務相較于大參數模型其響應速度更快,同時也具備體現思考過程的能力:
模型自強、算力自強、平臺自強,100%國產AI的新時代已然來臨。與其在“制裁-替代-再制裁”的循環(huán)中疲于奔命,不如和我們一起在國產 AI 的土壤上,種出下一個時代的參天大樹。
訪問 Gitee AI,體驗基于沐曦算力的 DeepSeek R1,開啟你的100%國產AI開發(fā)之旅!
(免責聲明:本網站內容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網站出現的信息,均僅供參考。本網站將盡力確保所提供信息的準確性及可靠性,但不保證有關資料的準確性及可靠性,讀者在使用前請進一步核實,并對任何自主決定的行為負責。本網站對有關資料所引致的錯誤、不確或遺漏,概不負任何法律責任。
任何單位或個人認為本網站中的網頁或鏈接內容可能涉嫌侵犯其知識產權或存在不實內容時,應及時向本網站提出書面權利通知或不實情況說明,并提供身份證明、權屬證明及詳細侵權或不實情況證明。本網站在收到上述法律文件后,將會依法盡快聯系相關文章源頭核實,溝通刪除相關內容或斷開相關鏈接。 )