7月29日消息,在今晚舉辦的理想i8上市發布會上,理想自動駕駛負責人郎鹹朋上台分享了理想自研VLA司機大模型的相關內容,據悉,這是一款視覺語言行動模型。
VLA即Vision-Language-Action Model,理想汽車希望該模型能讓AI真正成爲司機,成爲交通領域的專業生産工具,像人類司機一樣工作,甚至喊出了買車送司機”的口號。
VLA的實現是一個進化過程,經曆了三個階段。
第一阶段是2021年起自研的依赖规则算法和高精地图的辅助驾驶,类似 昆虫动物智能”。
第二阶段是2023年起研究,并于2024年正式推送的端到端 VLM 辅助驾驶,接近 哺乳动物智能”。
第三阶段的 VLA 开启 人类智能” 阶段,能通過3D和2D視覺的組合完整看到物理世界,且擁有完整的腦系統,具備語言、思維鏈推理能力,既能看,也能理解並真正執行行動。
VLA司機大模型以 司机 Agent(智能体)” 的产品形态呈现,用户可通过自然语言与司机Agent沟通,简单通用的短指令由端侧的VLA直接处理,复杂指令则先由云端的VL基座模型解析,再交由VLA处理。
理想汽车依托自有编译团队,自研底层推理引擎,使英伟达Orin-X芯片可通过INT4量化的方式运行VLM,并且凭借芯片、控制器设计和自研汽车操作系统等综合能力,实现了让双Orin-X芯片和Thor-U芯片运行同等规模的VLA司機大模型。
也正因如此,所有理想汽车Max版车型,即便是2022款理想L9 Max,均可升级到VLA司機大模型。
此外,郎咸朋还表示,搭载了地平线J6M智驾芯片的Pro车型(焕新版理想L系和i8 Pro),将在今年底升级城市NOA功能。
(舉報)