谷歌發(fā)布小鋼炮模型Gemma 3n:2GB內(nèi)存本地玩轉(zhuǎn)AI多模態(tài),掀起AI新革命!

谷歌發(fā)布小鋼炮模型Gemma 3n:2GB內(nèi)存本地玩轉(zhuǎn)AI多模態(tài),掀起AI新革命!

隨著科技的飛速發(fā)展,谷歌再次引領(lǐng)行業(yè)潮流,發(fā)布了全新的Gemma 3n端側(cè)多模態(tài)模型。這款模型以其強大的性能和卓越的靈活性,無疑將在AI領(lǐng)域掀起一場新的革命。

Gemma 3n是一款支持在手機、平板和筆記本電腦上本地運行,處理音頻、文本、圖片和視頻多種數(shù)據(jù)類型的多模態(tài)模型。相較于前不久發(fā)布的預覽版,其完整版在性能表現(xiàn)上有了顯著提升,重點提升了編碼和推理方面的能力。不僅如此,Gemma 3n還提供了兩種規(guī)模版本,以滿足不同硬件設(shè)備的需求。

在架構(gòu)方面,Gemma 3n創(chuàng)新采用了MatFormer架構(gòu),通過一個較大模型內(nèi)部包含一個較小但完全功能的版本,讓單一模型能夠根據(jù)不同任務以不同大小運行。這種架構(gòu)的運用,極大地提升了模型的計算靈活性。此外,Gemma 3n還使用了Per Layer Embeddings(PLE)以提升內(nèi)存效率,以及MobileNet-v5視覺編碼器等創(chuàng)新技術(shù)。

值得一提的是,Gemma 3n在多語言(支持140種語言的文本和35種語言的多模態(tài)理解)、數(shù)學、編碼和推理方面都實現(xiàn)了質(zhì)量提升。這一全面的能力提升,使其在各種場景下都能展現(xiàn)出卓越的性能。

在性能基準方面,Gemma 3n的較大模型E4B是首個參數(shù)量低于10B但LMArena得分超過1300的模型,這無疑證明了其在性能上的領(lǐng)先地位。而模型的音頻能力現(xiàn)在更是支持設(shè)備上的語音轉(zhuǎn)文本和翻譯,使用一個能夠處理細致語音的編碼器。視覺方面則由一個名為MobileNet-V5的新編碼器提供動力,比前代更快、更高效。它能在Google Pixel設(shè)備上以最高60FPS處理視頻。

更令人振奮的是,Gemma 3n能夠在2GB內(nèi)存的硬件上本地運行,這無疑為更多的用戶提供了廣闊的應用空間。在當今的移動設(shè)備日益普及的時代,這樣的設(shè)計無疑更能滿足廣大用戶的需求。

總的來說,谷歌發(fā)布的Gemma 3n端側(cè)多模態(tài)模型無疑是一款具有劃時代意義的作品。它以強大的性能和卓越的靈活性,為AI領(lǐng)域帶來了新的革命。未來,我們期待Gemma 3n能在更多的應用場景中發(fā)揮其卓越的性能,為人們的生活帶來更多的便利和樂趣。正如谷歌所宣稱的那樣,“2GB內(nèi)存本地玩轉(zhuǎn)AI多模態(tài)”,這無疑是對Gemma 3n強大性能的最佳詮釋,也預示著AI技術(shù)將在未來得到更廣泛的應用和普及。

(免責聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準確性及可靠性,但不保證有關(guān)資料的準確性及可靠性,讀者在使用前請進一步核實,并對任何自主決定的行為負責。本網(wǎng)站對有關(guān)資料所引致的錯誤、不確或遺漏,概不負任何法律責任。
任何單位或個人認為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權(quán)或存在不實內(nèi)容時,應及時向本網(wǎng)站提出書面權(quán)利通知或不實情況說明,并提供身份證明、權(quán)屬證明及詳細侵權(quán)或不實情況證明。本網(wǎng)站在收到上述法律文件后,將會依法盡快聯(lián)系相關(guān)文章源頭核實,溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。 )

贊助商
2025-06-27
谷歌發(fā)布小鋼炮模型Gemma 3n:2GB內(nèi)存本地玩轉(zhuǎn)AI多模態(tài),掀起AI新革命!
谷歌發(fā)布小鋼炮模型Gemma 3n:2GB內(nèi)存本地玩轉(zhuǎn)AI多模態(tài),掀起AI新革命! 隨著科技的飛速發(fā)展,谷歌再次引領(lǐng)行業(yè)潮流,發(fā)布了全新的Gemma...

長按掃碼 閱讀全文