3月18日消息,今日,理想汽車發(fā)布下一代自動駕駛架構MindVLA。
理想汽車 CEO 李想在微博表示,它將空間智能、語言智能和行為智能統(tǒng)一在一個模型里,讓自動駕駛擁有感知、思考和適應環(huán)境的能力,是我們通往L4路上最重要的一步。
MindVLA能為自動駕駛賦予類似人類的駕駛能力,就像iPhone 4重新定義了手機,MindVLA也將重新定義自動駕駛。
理想汽車自動駕駛技術研發(fā)負責人賈鵬表示:“MindVLA是機器人大模型,它成功整合了空間智能、語言智能和行為智能,一旦跑通物理世界和數(shù)字世界結合的范式后,將有望賦能更多行業(yè)。MindVLA將把汽車從單純的運輸工具轉變?yōu)橘N心的專職司機,它能聽得懂、看得見、找得到。我們希望MindVLA能為汽車賦予類似人類的認知和適應能力,將其轉變?yōu)槟軌蛩伎嫉闹悄荏w?!?/p>
據(jù)了解,MindVLA不是簡單地將端到端模型和VLM模型結合在一起,所有模塊都是全新設計。3D空間編碼器通過語言模型,和邏輯推理結合在一起后,給出合理的駕駛決策,并輸出一組Action Token(動作詞元),Action Token指的是對周圍環(huán)境和自車駕駛行為的編碼,并通過Diffusion(擴散模型)進一步優(yōu)化出最佳的駕駛軌跡,整個推理過程都要發(fā)生在車端,并且要做到實時運行。
MindVLA將為用戶帶來全新的產品形態(tài)和產品體驗,有MindVLA賦能的汽車是聽得懂、看得見、找得到的專職司機。
“聽得懂”是用戶可以通過語音指令改變車輛的路線和行為,例如用戶在陌生園區(qū)尋找超市,只需要通過理想同學對車輛說:“帶我去找超市”,車輛將在沒有導航信息的情況下,自主漫游找到目的地;車輛行駛過程中,用戶還可以跟理想同學說:“開太快了”“應該走左邊這條路”等,MindVLA能夠理解并執(zhí)行這些指令。
“看得見”是指MindVLA具備強大的通識能力,不僅能夠認識星巴克、肯德基等不同的商店招牌,當用戶在陌生地點找不到車輛時,可以拍一張附近環(huán)境的照片發(fā)送給車輛,擁有MindVLA賦能的車輛能夠搜尋照片中的位置,并自動找到用戶。
“找得到”意味著車輛可以自主地在地庫、園區(qū)和公共道路上漫游,其中典型應用場景是用戶在商場地庫找不到車位時,可以跟車輛說:“去找個車位停好”,車輛就會利用強大的空間推理能力自主尋找車位,即便遇到死胡同,車輛也會自如地倒車,重新尋找合適的車位停下,整個過程不依賴地圖或導航信息,完全依賴MindVLA的空間理解和邏輯推理能力。
總結來說,對于用戶而言,有MindVLA賦能的車不再只是一個駕駛工具,而是一個能與用戶溝通、理解用戶意圖的智能體。
- 微信警告不要使用第三方工具管理聊天記錄 會帶來三大風險
- 2025五一檔新片總票房破億 《水餃皇后》持續(xù)領跑
- 快手調整組織架構:成立可靈AI事業(yè)部 蓋坤任負責人
- 報告:抖音月活用戶破10億 人均每天刷抖音超1.5小時
- 從家庭連接到智能共生:中興通訊首推AI家庭“四大件”
- 紫光國微2025年Q1凈利潤1.19億元,同比下降61.11%
- 尚網(wǎng)網(wǎng)絡與南京公交集團達成戰(zhàn)略合作 共建智慧出行新生態(tài)
- 華為發(fā)布AI數(shù)據(jù)湖解決方案,加速行業(yè)智能化
- 淘寶宣布加入外賣大戰(zhàn),“小時達”升級為“閃購” 5月6日全國鋪開
- 中國電信柯瑞文:全面深入實施云改數(shù)轉戰(zhàn)略 把握人工智能發(fā)展趨勢
免責聲明:本網(wǎng)站內容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準確性及可靠性,但不保證有關資料的準確性及可靠性,讀者在使用前請進一步核實,并對任何自主決定的行為負責。本網(wǎng)站對有關資料所引致的錯誤、不確或遺漏,概不負任何法律責任。任何單位或個人認為本網(wǎng)站中的網(wǎng)頁或鏈接內容可能涉嫌侵犯其知識產權或存在不實內容時,應及時向本網(wǎng)站提出書面權利通知或不實情況說明,并提供身份證明、權屬證明及詳細侵權或不實情況證明。本網(wǎng)站在收到上述法律文件后,將會依法盡快聯(lián)系相關文章源頭核實,溝通刪除相關內容或斷開相關鏈接。