deepseek后首個!MiniMax連發(fā)5個產品刷爆外網

在全球AI競賽進入“下半場”的關鍵節(jié)點,一家來自上海的AI獨角獸公司——MiniMax,用一場史無前例的“技術發(fā)布周”,宣告其在基座模型、多模態(tài)技術和通用智能體Agent、視頻Agent等領域的全面突破。

那么,在這場不斷進擊極限的賽道上,他們是如何率先沖破技術邊界、跨越現(xiàn)有上限的?

一、開源MiniMax-M1 重塑成本效益

當下,人們對AI的態(tài)度愈發(fā)務實,AI競賽的焦點逐漸從模型參數(shù)轉向效率成本和落地能力的綜合比拼。

美國斯坦福大學發(fā)布的《人工智能指數(shù)報告》(AI Index Report 2025)首次對推理成本進行了追蹤,報告顯示,推理成本在過去兩年中降幅超過 280 倍。硬件層面,成本每年下降約 30%,而能效每年提升約 40%,成本效益顯著提升。

近期,大規(guī)模混合架構推理模型MiniMax M1重磅開源,重塑成本效益,閉源模型的技術壁壘被開源力量快速消解。

MiniMax-M1發(fā)布后在海外引起了開發(fā)者的廣泛探討:

社交平臺X知名AI博主MinChoi評論稱,MiniMax-M1簡直可以說集Manus 、Deep Research、計算機技能和可愛于一體,隨即他還展出了自己用MiniMax-M1做的10個有趣案例;美國知名科技媒體 VentureBeat 稱為“正在攪動全球模型格局”,并成為當前開源體系下極具代表性的高性價比大模型;科技媒體The Decoder 則將其性能對標 Google Gemini 2.5 Pro,進一步印證了 MiniMax 在全球技術版圖上的崛起地位。

MiniMax M1被譽為“全球首個開源大規(guī)模混合架構的推理模型”,其核心價值不僅在于多個生產力場景中比肩甚至超越頂尖閉源模型,更在于其極致的成本效益和技術創(chuàng)新,為AI的規(guī)?;瘧锰峁┝巳驴赡?。

其獨特的“閃電注意力”(Lightning Attention)混合架構與創(chuàng)新性的CISPO算法,在實現(xiàn)業(yè)內最高的100萬上下文的輸入與業(yè)內最長的8萬Token的推理輸出的同時,可以大幅提升計算效率。

技術報告顯示,在進行8萬Token深度推理時,所需算力僅為同賽道強手DeepSeek R1的約30%,實現(xiàn)了性能與效率的完美統(tǒng)一。在最新的 Artificial Analysis Intelligence Index 榜單中,MiniMax M1位列全球開源模型第二名。

更快的收斂意味著更少的訓練時間和資源消耗。得益于CISPO算法的高效,M1模型的整個強化學習階段僅使用了512塊英偉達H800 GPU,耗時三周,成本僅為53.5萬美元。

MiniMax官方表示,這一成本“比最初的預期少了一個數(shù)量級”,足見其技術路線在成本控制上的巨大潛力。

二、Hailuo02:突破物理極限 實現(xiàn)電影級AI視頻創(chuàng)作

在M1攪動語言模型市場的同時,MiniMax近期的另一款發(fā)布——新一代視頻生成模型Hailuo 02,則在多模態(tài)領域投下了一顆更具視覺沖擊力的“炸彈”。

據(jù)介紹,這是目前全球唯一一個可以實現(xiàn)類似高復雜物理場景的視頻大模型。一經發(fā)布,海外社交媒體上便充滿了Hailuo 02生成的高難度動作視頻,其中一個貓咪跳水的視頻5 小時就引得超過全球上億人圍觀。

具體來說,Hailuo 02的核心突破,在于其創(chuàng)新的Noise-aware Compute Redistribution(NCR)架構,在將模型參數(shù)和訓練數(shù)據(jù)量分別提升3倍和4倍的同時,實現(xiàn)了2.5倍的效率飛躍。

在國際權威測評榜單Artificial Analysis視頻競技場中,Hailuo-02一經發(fā)布便迅速拿下全球第二的寶座,領先于Google Veo3和快手可靈(Kling)。

可以看出,最終呈現(xiàn)的效果是驚人的,原生1080P高清畫質直接輸出電影級的視頻畫面;極限復雜運動場景的實現(xiàn)體操運動員在空中連續(xù)翻轉的流暢身姿、馬戲演員噴火時火花與光影的逼真互動,輕松實現(xiàn)這些對時空一致性和物理邏輯性要求極高的場景。同時,受益于模型架構創(chuàng)新,海螺02模型官方價格顯著低于Runway、可靈等國內外同行,實現(xiàn)行業(yè)底價。

總結來說,Hailuo-02在對物理世界規(guī)律的理解和表現(xiàn)上,已經實現(xiàn)了全球性的突破,更以“世界一流的效果”和“顛覆性的成本效益”,直接叫板Veo3等國際頂尖模型。

三、發(fā)布MiniMax Agent “解放用戶手腳”

如果說M1和Hailuo-02是MiniMax強大的“發(fā)動機”和“眼睛”,那么同步官宣的通用智能體產品——MiniMax Agent,則是這家公司對“AI能力”的深刻思考和交付回答。

這個可以完成長程復雜任務(Long Horizon Complex Tasks)的通用智能體,不僅能多步規(guī)劃出專家級解決方案、靈活拆解任務需求,還能執(zhí)行多個子任務,從而交付最終結果。

比如面對“Mag 7投資組合雙移動平均線策略收益率分析”這類需要大量信息搜集、篩選和驗證的開放式任務,MiniMax Agent能夠活用多種工具,進行深度的網絡研究,并最終給出精準、可靠的建議。

無論是做一套中學物理課件,還給《長安的荔枝》做一個劇情介紹網站,MiniMax Agent所制作的PPT均是排版靈活、視覺美觀,網頁更像是文化機構做的宣傳站點,甚至能用3D 動態(tài)演示發(fā)動機的四個沖程,效果能直接用于教學。

“做一套中學物理課件,講沖量和動量,要帶動畫演示”

“根據(jù)馬伯庸小說《長安的荔枝》,做一個劇情介紹網站,風格設計自己定”

這些案例,僅僅是MiniMax Agent強大交付能力的冰山一角。

據(jù)悉,在MiniMax 內部,該產品已經被使用了兩個月,逐漸成為內部超過50%的員工日常使用的產品。

四、Hailuo Video Agent 開啟“Vibe Videoing”創(chuàng)作時代

為了大幅降低視頻創(chuàng)作門檻,讓用戶以自然語言輸入即可一鍵生成專業(yè)級成片,MiniMax推出了國內首個實現(xiàn)“成片直出”的視頻創(chuàng)作智能體——Hailuo Video Agent,開啟“零門檻Vibe Videoing”創(chuàng)作時代,用戶可以自動分析、構思并生成具有專業(yè)水準、富有觀看價值的完整視頻內容。

曾經奉行“規(guī)模至上”的Scaling Law教條正被多元創(chuàng)新路徑瓦解。具體來說,MiniMax在視頻Agent中實現(xiàn)了以下技術創(chuàng)新:

自然語言驅動全局:拋棄傳統(tǒng)工作流+節(jié)點的工具模式,通過LLM語言模型,AI自動拆解任務并調用最佳工具鏈,創(chuàng)新性地支持用戶在自然語言描述中構建完整視頻,從而降低創(chuàng)作門檻、提升普通用戶的創(chuàng)意空間。全流程工具集:打造視頻構思、資料收集、分鏡制作、剪輯、配音等視頻制作全流程工具集,并通過Agent模型在不同階段實現(xiàn)自動調用,根據(jù)創(chuàng)作階段智能匹配最優(yōu)方案,從而Agent在自動化創(chuàng)作的同時保證視頻質量。創(chuàng)作過程可視化:通過Agent思維鏈實時展示AI工作邏輯,為自定義編輯提供可視窗口與操作空間。Agent創(chuàng)作的透明化可操作窗口,讓用戶不僅可以有效監(jiān)控AI創(chuàng)作流程,還能有效介入,實現(xiàn)可控的視頻創(chuàng)作。

可以說,這款視頻創(chuàng)作智能體不僅降低了用戶創(chuàng)作門檻、保證視頻的專業(yè)級質量,在更大程度地提升普通用戶創(chuàng)作自由度的同時,可以讓人與AI更好地進行雙向協(xié)同。

據(jù)MiniMax透露,海螺視頻Agent將通過三階段進化,打開用戶的創(chuàng)作自由度。目前已經實現(xiàn)第一階段能力,第二階段的視頻Agent創(chuàng)作工具將于2025年夏季面世。

五、Voice design上新

此外,MiniMax同期發(fā)布的模型還包含語音模型Speech 02上的一個功能更新——Voice Design 音色設計。

用戶可以通過自然語言來描述自己心中所想的音色,實現(xiàn)對多個維度的精準控制,甚至生成世界上不存在的音色。還能與Speech 02語音模型在鏈路上相配合,用戶在文字轉語音中可真正實現(xiàn)“所需即所得”,以“任意語言 × 任意口音 × 任意音色”,實現(xiàn)可全自定義的無限組合。

實際上,早在今年5月中旬,語音模型 Speech-02一經發(fā)布,即登頂國際權威語音評測榜單Artificial Analysis,收獲了全球用戶的廣泛肯定。Speech-01/02兩代模型已經幫助用戶生成了累計超過1.5億小時的語音,并與超過30個國家的客戶實現(xiàn)了合作落地。

據(jù)悉,通過Voice Design的方式生成聲音,解決了語音合成模型行業(yè)的兩個挑戰(zhàn):精準匹配細分場景下的多樣需求、無需復刻他人聲音即可無風險實現(xiàn)腦海中音色表達。這將持續(xù)降低全球用戶使用AI技術的門檻,讓說各種語言的人都能感受到語音模型所帶來的價值。

總結:一場“中國震撼”背后的自主創(chuàng)新之路

當我們回望那些閃耀于歷史長河中的科技成果時會發(fā)現(xiàn):真正偉大的不是某項具體發(fā)明本身,而是創(chuàng)造者們不懈追求卓越精神所帶來的啟示,影響深遠的價值遠超物質層面的成就。

從全球首個開源大規(guī)?;旌霞軜嬐评砟P蚆iniMax-M1、到實現(xiàn)極致物理表現(xiàn)的視頻模型Hailuo-02、定義“靠譜”生產力的MiniMax Agent、國內首個成片創(chuàng)作助手Hailuo Agent、再到音色設計Voice Design,這一系列密集發(fā)布不僅是對其技術積累的集中展示,更是在這場全球AI競賽中,為行業(yè)發(fā)展路徑和競爭格局注入了全新的、顛覆性的變量。

技術的邊界,從未是束縛的枷鎖,而是激發(fā)挑戰(zhàn)自我、突破極限的戰(zhàn)場。

正如業(yè)內對MiniMax的評價,其創(chuàng)新之路為全球AI發(fā)展提供了第二條道路。面對外部的算力限制和技術封鎖,MiniMax沒有選擇跟隨和模仿,而是堅定地走了“自主創(chuàng)新”這條更艱難的路。

從底層基礎模型優(yōu)化,到開創(chuàng)性的線性注意力混合架構,再到CISPO和NCR等算法與架構的持續(xù)迭代,MiniMax的創(chuàng)新呈現(xiàn)出一種“環(huán)環(huán)相扣、層層遞進”的良性循環(huán)。這種“倒逼出來的創(chuàng)新能力”,證明了通過算法和架構的深度優(yōu)化,完全可以打破“算力-資本”的壁壘。

所有這些令人驚嘆的突破都在提醒著我們一件事,沒有絕對不可逾越的技術障礙, 只有尚未被發(fā)掘出來的解決方案。

其開源策略更具深意。在全球AI巨頭紛紛轉向閉源以構建技術壁壘的當下,MiniMax選擇向世界開放其大語言模型的核心能力,這不僅是對技術封鎖的有力反擊,更彰顯了中國新一代AI企業(yè)的技術自信和開放胸懷。

在AI文明向多極化演進的新開端,未來的技術史詩,將由東西方共同書寫。

免責聲明:此文內容為第三方自媒體作者發(fā)布的觀察或評論性文章,所有文字和圖片版權歸作者所有,且僅代表作者個人觀點,與極客網無關。文章僅供讀者參考,并請自行核實相關內容。投訴郵箱:editor@fromgeek.com。

免責聲明:本網站內容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網站出現(xiàn)的信息,均僅供參考。本網站將盡力確保所提供信息的準確性及可靠性,但不保證有關資料的準確性及可靠性,讀者在使用前請進一步核實,并對任何自主決定的行為負責。本網站對有關資料所引致的錯誤、不確或遺漏,概不負任何法律責任。任何單位或個人認為本網站中的網頁或鏈接內容可能涉嫌侵犯其知識產權或存在不實內容時,應及時向本網站提出書面權利通知或不實情況說明,并提供身份證明、權屬證明及詳細侵權或不實情況證明。本網站在收到上述法律文件后,將會依法盡快聯(lián)系相關文章源頭核實,溝通刪除相關內容或斷開相關鏈接。

2025-06-25
deepseek后首個!MiniMax連發(fā)5個產品刷爆外網
deepseek后首個!MiniMax連發(fā)5個產品刷爆外網

長按掃碼 閱讀全文