最近跟一位企業(yè)的CIO交流,對方關于大模型的認知讓我驚呆了,他說,“聽說做私域大模型要兩千萬的軟件投入和兩千萬的算力投入,我們公司沒有這個預算”。
于是我問道:“那如果按照你們公司的數(shù)據(jù)基礎和業(yè)務場景,只需要十分之一甚至更少的投入,你愿意做大模型嗎?”
他馬上表示:“這個預算可以搞!”
如果只關注基礎模型廠商和賣“鏟子”的英偉達的發(fā)布會,會覺得大模型立馬就可以將企業(yè)用戶“帶飛”。事實上,很多企業(yè)在應用大模型時,還有大量的困惑與難題。
比如以為需要大算力、大投入,要么望而卻步,要么盲目囤了很多卡/服務器,卻發(fā)現(xiàn)基座模型與業(yè)務融合的過程漫長且復雜,涉及大量試錯、調優(yōu)等工作,后續(xù)訓練、推理、部署等環(huán)節(jié)的算力資源消耗與浪費情況,是容易被忽略的隱藏問題。
這有點像我們要去一個地形復雜、風景優(yōu)美的陌生城市旅游,提前按照攻略買好了各種機酒門票,但實際行程卻總被意外情況拖慢,無法高效地推進,導致很多資源都被浪費掉了。
企業(yè)做大模型也是如此。大模型開發(fā),涉及一個相當漫長且復雜的產業(yè)鏈,每個環(huán)節(jié)對于企業(yè)用戶來說,都有相對陌生的地方,難以將稀缺昂貴的算力發(fā)揮出最大價值。
企業(yè)能否落地大模型的關鍵,就在于是否能夠將不同環(huán)節(jié)的技術、產品整合起來,構筑一體化的解決方案。怎么實現(xiàn)呢?
腦極體曾報道過,相比單純售賣AI服務和API的商業(yè)模式,開箱即用的大模型一體機,能夠縮短部署周期、深度結合場景、降低落地門檻,是更符合當下國內大模型產業(yè)現(xiàn)狀的一種選擇,解決企業(yè)在AI落地過程中的最后一公里問題。
最近,我們關注到潞晨科技也推出了訓推一體機,在集成高性能硬件的基礎上,還集成了Colossal-AI加速框架,支持多種微調fine-tune方式,幫助企業(yè)更輕松地實現(xiàn)AI技術的深度融合和業(yè)務創(chuàng)新。
我想,如果開篇中那位CIO更早認識了這款產品,肯定不會因軟硬件成本而對大模型望而卻步,可以放心大膽地踏上AI創(chuàng)新之旅。
本文就以潞晨訓推一體機為例,聊聊一體機如何將遠方未知的大模型技術,變成企業(yè)身邊的AI風景,又如何打磨好“一條龍式”的一站式AI解決方案。
散裝的大模型,在跋涉中折騰的企業(yè)
提到互聯(lián)網,我們會想到電商、直播、手機游戲、社交媒體等豐富多彩的應用,而不是光纖、網關、路由器這些底層設施。但觀察今天的企業(yè),提到大模型,第一時間想到的依然是算卡、API、tokens這些詞,而不是適配業(yè)務的AI應用。盡管企業(yè)迫切希望運用大模型來加速業(yè)務創(chuàng)新,但在實際操作中卻可能面臨各種各樣的問題。
大模型訓練、推理、部署的一系列環(huán)節(jié),都是“散裝”的,不成體系。企業(yè)想用業(yè)務數(shù)據(jù)做專屬大模型,得一山一水地跋涉,不僅效率低,還會在選型、適配、兼容、迭代等各個階段反復折騰,走很多彎路,吃不少悶虧。
舉個例子,今天,高端AI算力依然是中小微企業(yè)難以搞定的珍稀資源,好不容易搞來了算卡,一個模型在TensorFlowPyTorch上跑一次好幾天,驗證一次好幾天,發(fā)現(xiàn)問題迭代調試,流程再來一遍,眼看著友商已經用上了AI,只能干著急。這種進度,顯然是追求競爭效率和創(chuàng)新速度的企業(yè)所難以接受的。
所以目前這個階段,大量企業(yè)都不希望“散裝”亂折騰,大模型致用,需要一條龍解決方案,即軟硬件緊耦合的大模型一體機。
目前,有許多國內頭部AI廠商和ICT服務商都推出大模型一體機。為什么我們會關注到潞晨科技的訓推一體機呢?
企業(yè)做大模型,“散裝自由行”有些昂貴和繁瑣,潞晨訓推一體機的深度優(yōu)化與打磨,帶來了“訓推一條龍”路線圖,在企業(yè)和大模型之間架起了一條效率高速。奔跑在潞晨訓推一體機上的企業(yè)大模型之旅,能看到怎樣的風景?
第一道風景:訓推協(xié)同的澎湃算力,助推企業(yè)創(chuàng)新
做大模型,跟旅游一樣,最掃興的情況就是目的地還沒到,隊友已經走不動了。大模型訓練中,因硬件性能不足、聯(lián)接故障而中斷,會帶來時間成本和機會成本的損失。
高性能硬件的澎湃算力供給,是企業(yè)用好大模型的前提條件,也是潞晨訓推一體機帶給企業(yè)的第一道風景線。
目前,NVIDIA GPU是AI芯片 “一哥”,在AI訓練領域一家獨大,幾乎無敵手。潞晨訓推一體機,采用英偉達H20作為底層硬件,每臺一體機配有8張H20卡,每卡有高達96GB的顯存,在單臺設備上即可完成 32B Qwen1.5 模型的全參數(shù)微調,更可支持單卡 34B Yi1.5模型的推理。
H20采用Hopper架構,卡間互聯(lián)速度達到了驚人的900GB/s,整機配備4個400GB/s的IB網口,無論是多卡互聯(lián)還是多機互聯(lián),都有極高的效率。這對于需要大規(guī)模并行計算和協(xié)同工作的AI任務尤為重要,可以減少等待時間,提高開發(fā)效率。
參數(shù)大代表了硬件的“發(fā)動機”強,還需要結合框架這一“動力引擎”,壓榨出硬件的最優(yōu)性能表現(xiàn)。與硬件適配度更高的框架,協(xié)同更高效,可以帶來更高的訓練推理效率。比如,潞晨科技就為這套硬件量身定做了極致優(yōu)化的訓推加速方案。
使用Colossal-AI優(yōu)化,在8卡規(guī)模下的上機實測中,平均每卡算力相較原生速度提升21%,大幅度提高效率。微調Qwen 7B的大模型,僅需半天,即可完成1B數(shù)據(jù)的學習與迭代。
總結一下,潞晨訓推一體機性能領先、軟硬協(xié)同、訓推一體的緊耦合架構,降低了使用大模型的門檻和成本。企業(yè)可以減少人力和物力的投入,“輕裝上陣”踏上業(yè)務創(chuàng)新之旅,探索代表未來的智能世界。
第二道風景:內置軟件,帶來轉型松弛感
算力作為動力,而模型算法才是業(yè)務價值和競爭力的創(chuàng)造者。企業(yè)探索AI,既要選擇先進的基礎模型,來確保高效、準確的預測和決策能力,又要將模型與業(yè)務深度結合,確保開發(fā)出來的AI產品能夠滿足業(yè)務邏輯和需求,為企業(yè)帶來真正的商業(yè)價值。
那么問題來了,如何獲得更適合企業(yè)業(yè)務需求的先進模型,并輕松上手?
潞晨訓推一體機的“一條龍”路線圖,在模型層、平臺層、應用層,都內置了定制的AI軟件,方便使用。
模型層:潞晨訓推一體機集成了眾多精選的優(yōu)質開源模型,例如LLaMA3、Mixtral、Qwen等,方便企業(yè)用戶調用,快速體驗到不同開源模型的能力。同時,借助潞晨訓推框架的優(yōu)化,上述模型在一體機上的訓練推理效率,會比原生硬件更高。
平臺層:平臺層的軟件工具下接算力、上接應用,讓大模型從底層算力到上層應用,實現(xiàn)順暢運行和高效協(xié)作。潞晨訓推一體機搭載的訓推軟件Colossal LLM Studio,配備了直觀易用的UI界面,讓非技術背景的用戶也能輕松操作,通過低代碼、可視化的方式進行模型訓練微調,企業(yè)不再需要付費外包,一個軟件就相當于一支大模型訓練團隊。
應用層:開箱即用的AI應用,實用性強,可以將大模型的能力快速集成到企業(yè)現(xiàn)有的業(yè)務系統(tǒng)或應用中,帶來實際的價值和效益。通過潞晨訓推一體機,企業(yè)用戶用到潞晨科技推出的Colossal Reader,一款專為提升文檔理解效率而設計的AI智能助手。一方面,經過精細調整和優(yōu)化的 RAG 流程,具備長文本能力,支持深度解析復雜文檔,如財務報表和法律文件,幫助用戶迅速掌握關鍵信息,實現(xiàn)高效辦公。同時,基于一體機的私有化部署既保證了長期使用的穩(wěn)定,又保障了企業(yè)內部文檔等的數(shù)據(jù)安全。
Sora開啟了文生視頻的新階段,展現(xiàn)出AIGC在影視制作、游戲開發(fā)和廣告創(chuàng)意等方面的諸多可能。企業(yè)想在業(yè)務中引入類Sora能力,潞晨訓推一體機上,免費提供Open-Sora開源版本的本地推理部署。
潞晨科技團隊傾力打造的文生視頻大模型Open-Sora,自3月19日登上GitHub Trending榜,受到大量開發(fā)者關注,星數(shù)持續(xù)增長,熱度僅次于Grok-1。其中LambdaLabs團隊基于Open-Sora模型進行微調打造了一個具有獨特藝術風格的樂高動畫世界,展現(xiàn)了潞晨科技的技術領先性和實力。而這一優(yōu)秀模型,潞晨訓推一體機的用戶可以直接在本地部署,基于高配硬件,結合企業(yè)的應用場景,將文生視頻能力落地在自身業(yè)務中。
從模型層、平臺層、應用層,潞晨訓推一體機完整的AI軟件體系支持,讓企業(yè)不必有“FOMO(害怕錯過)情緒”,快速上手大模型及應用。簡單易用的軟件風景,為企業(yè)探索大模型營造了難得的松弛感。
第三道風景:全周期服務,一路護航
有人會問,數(shù)據(jù)預處理、特征工程、模型訓練、部署與監(jiān)控等一系列復雜的工程化任務,帶來了大量挑戰(zhàn),企業(yè)是不是要構建一支既懂技術又懂業(yè)務的團隊?如果吸引不到這樣的人才怎么辦?
讓企業(yè)聚焦在業(yè)務創(chuàng)新上,需要相應的運維服務及售后服務,免除客戶的后顧之憂。
選擇潞晨訓推一體機的企業(yè)客戶,將獲得潞晨科技的技術團隊提供為期一周的免費專業(yè)咨詢服務,解決數(shù)據(jù)處理和模型選擇等技術問題,以及最高級別的服務優(yōu)先權,并將優(yōu)先支持其他付費服務。
我們知道,任何一個產業(yè)和企業(yè)都有自己的獨特性,即使擁有強大的通用性AI軟硬件,也容易施展不開手腳。讓大模型與行業(yè)特征、企業(yè)周期、業(yè)務場景相結合,是最難的一道關卡,也是潞晨科技希望通過服務加持助力企業(yè)消除與技術的隔閡。
獨行快、眾行遠,去陌生的技術領域探索未知的景色,這個過程中,企業(yè)和潞晨科技的攜手,讓AI風景可以長長久久地綿延下去。
一條龍深度游:“導游”潞晨的獨特AI打開方式
算力不折騰,簡單用,放心用,輕松用,潞晨訓推一體機改變了大模型開發(fā)的“散裝”流程,用“訓推一條龍”,推動大模型深入企業(yè)業(yè)務,加速落地。
從中,我們可以看到潞晨科技帶來的企業(yè)智能打開方式:
1.高集成。企業(yè)能夠在一個平臺上完成從模型訓練到部署的全過程,無需在多個系統(tǒng)或工具之間切換,大大提高了工作效率。
2.質價比。大模型,可以看做企業(yè)智能的“消費升級”,有望帶來更高的智慧水平。訓推一體機,提高算效,讓大模型變得物美價廉。總體來看,企業(yè)智能的質價比正在提高,成為新的競爭力。
3.廣覆蓋。訓推一體機降低了大模型應用門檻,意味著更多行業(yè)和企業(yè),尤其是缺乏自建智算中心能力的中小企業(yè)和傳統(tǒng)行業(yè),可以在低門檻、輕成本的前提下,快速進入智能階段,提高AI的滲透率和廣覆蓋。
作為企業(yè)智能的“一條龍導游”,潞晨訓推一體機,讓大模型從大廠實驗室和論壇峰會的神壇中走下來,進入企業(yè)觸手可及的范圍之內,變成水、電、網絡一樣的必需品和常規(guī)消費品。
撬動企業(yè)智能的龐大市場,潞晨訓推一體機正在兌現(xiàn)大模型的真正利好。欲知詳情,可移步潞晨科技公眾號。
免責聲明:此文內容為第三方自媒體作者發(fā)布的觀察或評論性文章,所有文字和圖片版權歸作者所有,且僅代表作者個人觀點,與極客網無關。文章僅供讀者參考,并請自行核實相關內容。投訴郵箱:editor@fromgeek.com。
免責聲明:本網站內容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網站出現(xiàn)的信息,均僅供參考。本網站將盡力確保所提供信息的準確性及可靠性,但不保證有關資料的準確性及可靠性,讀者在使用前請進一步核實,并對任何自主決定的行為負責。本網站對有關資料所引致的錯誤、不確或遺漏,概不負任何法律責任。任何單位或個人認為本網站中的網頁或鏈接內容可能涉嫌侵犯其知識產權或存在不實內容時,應及時向本網站提出書面權利通知或不實情況說明,并提供身份證明、權屬證明及詳細侵權或不實情況證明。本網站在收到上述法律文件后,將會依法盡快聯(lián)系相關文章源頭核實,溝通刪除相關內容或斷開相關鏈接。