国产美女在线精品免费,久久视频在线观看免费,天堂av官网,毛片网免费,国产日产欧产美韩av,日韩一区二区三区不卡视频,91久久久久久久久久

理想汽車押注“VLA”

發(fā)布日期：2025-05-08

摘要： VLA 司機(jī)模型【司機(jī)Agent】最后落地一定是一個(gè)端云一體化的產(chǎn)品【車端VLA 4B+云端 32B VL基座模型】。車端OrinX Thor 算力有限且需要低時(shí)延反應(yīng)，車端的VLA模型參量就一定大不到哪里去，因此一定需要用COT...

VLA 司機(jī)模型【司機(jī)Agent】最后落地一定是一個(gè)端云一體化的產(chǎn)品【車端VLA 4B+云端 32B VL基座模型】。車端OrinX Thor 算力有限且需要低時(shí)延反應(yīng)，車端的VLA模型參量就一定大不到哪里去，因此一定需要用COT 的方式將部分復(fù)雜場(chǎng)景分析放在云端VL模型中，將信息分析下放回車端完成完整的Token輸出后用擴(kuò)散模型轉(zhuǎn)換成軌跡再轉(zhuǎn)換成控制單元。

VLA的VL基座模型為什么要自己去預(yù)訓(xùn)練。如果不是用原生的基座模型。模型蒸餾以后其他LLM模型里面和駕駛場(chǎng)景無(wú)關(guān)的知識(shí)能力客觀來(lái)說(shuō)會(huì)影響模型本體的能力上限?！径嚩怂懔κ欠浅氋F的，因此做原生駕駛場(chǎng)景的基座模型就是一個(gè)非常艱難，但是必須要做的事情】【當(dāng)然如果某一家可能會(huì)有更高的車端算力，我覺(jué)得嘗試用第三方LLM去做蒸餾后強(qiáng)化學(xué)習(xí)也是可以嘗試一下，畢竟各家搞科研的VLA機(jī)器人都是用開(kāi)源的LLM】

VLA 相較于 E2E+VLM最大的兩個(gè)差異：

1)是沒(méi)有雙系統(tǒng)協(xié)同了，所以不需要用VLM去指揮E2E；

2)VLA因?yàn)樗行畔⒍际寝D(zhuǎn)成了Token在進(jìn)LLM【蒸餾后的基座模型，這里簡(jiǎn)化描述。部分復(fù)雜指令會(huì)上云進(jìn)VL模型】，因此多模態(tài)信息對(duì)齊在自動(dòng)駕駛領(lǐng)域第一次達(dá)成【實(shí)時(shí)視覺(jué)感知、語(yǔ)義信息、導(dǎo)航信息、駕駛員需求信息等等】。

用VLA可以讓，AD系統(tǒng)真的看懂、看清楚、理解【車機(jī)導(dǎo)航】，注意是理解車機(jī)導(dǎo)航和真實(shí)路口場(chǎng)景的匹配和真實(shí)的軌跡預(yù)期，而并非是理解車機(jī)導(dǎo)航的播發(fā)信息【現(xiàn)在XX米后右轉(zhuǎn)】

VLA構(gòu)架用了3dgs【用很多個(gè)小橢球+每個(gè)橢球一個(gè)高維度顏色來(lái)描述三維世界的，所以文字這類信息在他的表示里應(yīng)該算是復(fù)雜紋理，不知道能不能用3dgs的方式高效的表達(dá)且傳導(dǎo)給后面的llm】

現(xiàn)在給出的解法是用了2D Vit 和3D表征同時(shí)進(jìn)VLA模型，所以確實(shí)解決了3D場(chǎng)景的表達(dá)理解和文字信息的表達(dá)理解。

這個(gè)細(xì)節(jié)反向證明了，目前看VLA這個(gè)構(gòu)架圖【真實(shí)性、透明性】就是非常非常高的

相較于原來(lái)的端到端模型重復(fù)造輪子的就小多了。E2E 500wclips 升級(jí)到800W clips 其實(shí)是重新訓(xùn)練的VLA司機(jī)模型 1.0 和2.0 都是來(lái)自于32B 的VL模型蒸餾后強(qiáng)化學(xué)習(xí)做的，本質(zhì)上數(shù)據(jù)利用率會(huì)高的多的【大幅度減少了重復(fù)分析數(shù)據(jù)、匹配數(shù)據(jù)造輪子的工作】

能力提升的預(yù)測(cè)【客觀來(lái)說(shuō)，模型參量增加表現(xiàn)增強(qiáng)是客觀存在的】。E2E模型1000W clips的模型參量大概率是小于1B的，而VLA司機(jī)基座模型是【3.2+0.8=4B】。還有一個(gè)云端增強(qiáng)的32B的VL模型，大家能理解能力的增強(qiáng)？【復(fù)雜場(chǎng)景、真實(shí)理解、推理、長(zhǎng)時(shí)序】

VLA提升的并不是E2E模型的流暢性，而是提高的頂層思維能力

關(guān)于我們：ICC鑫欏資訊成立于2010年，主要服務(wù)于炭素、鋰電、電爐鋼3大行業(yè)，是中國(guó)領(lǐng)先的專業(yè)產(chǎn)業(yè)研究和顧問(wèn)公司。鑫欏資訊以研究為中心，提供媒體資訊、研究咨詢、數(shù)據(jù)庫(kù)和市場(chǎng)營(yíng)銷等解決方案。
鑫欏鋰電專注于鋰電池原材料、鋰電池及其下游等相關(guān)產(chǎn)業(yè)鏈跟蹤，對(duì)市場(chǎng)價(jià)格、行情動(dòng)態(tài)等資訊的搜集與研究，常年跟蹤行業(yè)內(nèi)400多家生產(chǎn)企業(yè)，擁有完善的產(chǎn)業(yè)數(shù)據(jù)庫(kù)。根據(jù)企業(yè)需求提供定制報(bào)告，為企業(yè)提供專業(yè)化服務(wù)。
鑫欏鋰電以研究為中心，服務(wù)于行業(yè)企業(yè)、金融機(jī)構(gòu)（一二級(jí)市場(chǎng)私募基金/券商/銀行等）、高校/科研院所、政府等，為客戶提供的獨(dú)特洞見(jiàn)、分析和資源，幫助客戶高效決策，以實(shí)現(xiàn)高質(zhì)量的業(yè)務(wù)增長(zhǎng)。

[ 資訊搜索 ] [ 加入收藏 ] [ 告訴好友 ] [ 打印本文 ] [ 關(guān)閉窗口 ]

同類資訊

資訊瀏覽

市場(chǎng)報(bào)價(jià)

• 特斯拉 FSD v14.1.3 新增自動(dòng)清潔前攝像頭功能	• 東風(fēng)汽車：已構(gòu)建自主可控的固態(tài)電池供應(yīng)鏈體系
• 小米汽車又一款新車曝光！YU7 GT頻現(xiàn)紐北路試，	• 廣汽集團(tuán)董事長(zhǎng)馮興：與華為合作“啟境”寓意“
• 工信部擬修訂《車輛出廠合格證》國(guó)標(biāo)，將包括組	• 通用汽車：第三季度營(yíng)收485.9億美元
• 日產(chǎn)與比亞迪在歐洲達(dá)成合作，共享汽車碳排放池	• Stellantis集團(tuán)與小馬智行合作
• 人事變動(dòng) \| 前長(zhǎng)城汽車AI Lab負(fù)責(zé)人加盟優(yōu)必選	• 蘭博基尼暫緩全面電動(dòng)化，CEO稱客戶仍渴望燃油