精品亚洲AⅤ无码一区二区三区,91香蕉亚洲精品

3月18日消息，今日，理想汽車發(fā)布下一代自動駕駛架構(gòu)MindVLA。

理想汽車 CEO 李想在微博表示，它將空間智能、語言智能和行為智能統(tǒng)一在一個模型里，讓自動駕駛擁有感知、思考和適應(yīng)環(huán)境的能力，是我們通往L4路上最重要的一步。

MindVLA能為自動駕駛賦予類似人類的駕駛能力，就像iPhone 4重新定義了手機，MindVLA也將重新定義自動駕駛。

理想汽車自動駕駛技術(shù)研發(fā)負(fù)責(zé)人賈鵬表示：“MindVLA是機器人大模型，它成功整合了空間智能、語言智能和行為智能，一旦跑通物理世界和數(shù)字世界結(jié)合的范式后，將有望賦能更多行業(yè)。MindVLA將把汽車從單純的運輸工具轉(zhuǎn)變?yōu)橘N心的專職司機，它能聽得懂、看得見、找得到。我們希望MindVLA能為汽車賦予類似人類的認(rèn)知和適應(yīng)能力，將其轉(zhuǎn)變?yōu)槟軌蛩伎嫉闹悄荏w。”

據(jù)了解，MindVLA不是簡單地將端到端模型和VLM模型結(jié)合在一起，所有模塊都是全新設(shè)計。3D空間編碼器通過語言模型，和邏輯推理結(jié)合在一起后，給出合理的駕駛決策，并輸出一組Action Token（動作詞元），Action Token指的是對周圍環(huán)境和自車駕駛行為的編碼，并通過Diffusion（擴(kuò)散模型）進(jìn)一步優(yōu)化出最佳的駕駛軌跡，整個推理過程都要發(fā)生在車端，并且要做到實時運行。

MindVLA將為用戶帶來全新的產(chǎn)品形態(tài)和產(chǎn)品體驗，有MindVLA賦能的汽車是聽得懂、看得見、找得到的專職司機。

“聽得懂”是用戶可以通過語音指令改變車輛的路線和行為，例如用戶在陌生園區(qū)尋找超市，只需要通過理想同學(xué)對車輛說：“帶我去找超市”，車輛將在沒有導(dǎo)航信息的情況下，自主漫游找到目的地；車輛行駛過程中，用戶還可以跟理想同學(xué)說：“開太快了”“應(yīng)該走左邊這條路”等，MindVLA能夠理解并執(zhí)行這些指令。

“看得見”是指MindVLA具備強大的通識能力，不僅能夠認(rèn)識星巴克、肯德基等不同的商店招牌，當(dāng)用戶在陌生地點找不到車輛時，可以拍一張附近環(huán)境的照片發(fā)送給車輛，擁有MindVLA賦能的車輛能夠搜尋照片中的位置，并自動找到用戶。

“找得到”意味著車輛可以自主地在地庫、園區(qū)和公共道路上漫游，其中典型應(yīng)用場景是用戶在商場地庫找不到車位時，可以跟車輛說：“去找個車位停好”，車輛就會利用強大的空間推理能力自主尋找車位，即便遇到死胡同，車輛也會自如地倒車，重新尋找合適的車位停下，整個過程不依賴地圖或?qū)Ш叫畔ⅲ耆蕾嘙indVLA的空間理解和邏輯推理能力。

總結(jié)來說，對于用戶而言，有MindVLA賦能的車不再只是一個駕駛工具，而是一個能與用戶溝通、理解用戶意圖的智能體。

理想發(fā)布下一代自動駕駛架構(gòu) 李想：通往L4 上最重要的一步

下一篇