理想汽车正在封闭开发下一代智能驾驶的VLA模型,这是一场豪赌,该公司致力于通过创新技术和持续研发,提供更高水平的智能驾驶体验,VLA模型的开发将助力理想汽车在智能驾驶领域取得更大突破,以满足消费者对智能出行的需求和期望。
理想汽车将在今年7月推出新款i8车型,随后数月内,理想的多款i系列纯电车将密集上市,为迎接这些新车,理想正在着手两件事:一是大规模建设5C超充站,二是提升智能驾驶能力到新的高度。
文|曹琳 编辑|冒诗阳
汽车像素(ID:autopix)原创
理想汽车正在急攻VLA(视觉-语言-动作)智驾大模型,我们独家了解到,该公司已启动封闭式开发,目标是在今年下半年突破VLA的落地难关,VLA是今年智能驾驶的核心竞赛之一,理想汽车、吉利汽车和元戎启行是VLA的主要推动者,三家公司都希望成为率先落地VLA的一方。
VLA的落地有其难度,除了模型本身的研发需要时间,硬件的限制也是无法逾越的,现在市面上可采购的芯片,性能基本都无法支持VLA的运行,供应商方案中,英伟达今年即将量产的Thor系列,有望能够解决这一问题。
在理想汽车内部,基于哪个芯片来开发未来产品的智驾方案,曾经历数轮变化,最初,理想启动的方案是基于英伟达Thor-U来开发,这也是元戎、吉利的方向,随后调整为基于自研芯片进行开发,但我们了解到,去年底理想的芯片项目“舒马赫”流片失败,之后虽然自研芯片的项目重新上路,但理想暂停了基于自研芯片所做的算力平台开发,继续沿用英伟达的Thor-U MAX进行开发。
智能驾驶每年都会有一轮新的技术竞赛,改变第一梯队的座次,2024年的竞赛是端到端智驾,理想的智能驾驶能力也将在这一年崭露头角,去年10月底,理想汽车宣布全量推送端到端+VLM大模型,超过30万理想AD MAX版本的车主成为首批尝鲜者,从实际效果来看,理想的端到端+VLM方案的确受到了较高的评价。
但现阶段的端到端大模型有其缺陷,比如决策不可解释、有少量难以预知的场景无法处理等,为了解决这些问题,理想在端到端模型的基础上,增加了一个VLM(视觉语言)模型,二者的组合可以理解为是,端到端大模型负责开车,VLM提供意见,为少量复杂场景兜底,这种组合虽然弥补了端到端大模型的不足,却并不能作为智能驾驶的终极解决方案。
理想的端到端和VLM仍然是相对独立的两个模型,在新模型中,多模态大模型不再作为辅助,而是内化为了端到端智驾大模型的一种能力,理想的路径适用于车辆保有量大且驾驶数据可有效回传的车企,随着技术的推进和时间的推移,落后者的机会窗口逐渐缩窄,因此他们必须迅速验证路径并追赶对手,今年将是智能驾驶接近决战的关键时刻,包括理想在内的一些车企将VLA视作智能驾驶未来的方向甚至是接近最终解决方案的技术路径,然而VLA的落地一直存在问题尚未解决需要研发人员深度交融两个模型的数据这十分考验研发团队对AI大模型框架的定义能力,另一个限制在于硬件端到端与VLM融合后车端模型参数会变得更大同时新模型需要更高效的完成实时推理理解复杂世界并给出建议这些都对车端芯片提出了更高的要求包括算力等现在多数车企高阶智驾的硬件方案基本都是两颗Orin-X芯片算力508 Tops不足以支持VLA包括理想i8等在内的很多车企旗舰车的上市时间集中在了今年下半年,此外华为小鹏等车企去年完成了端到端智驾方案的推送时间点早于理想他们的方案与理想不同但同样在推进智能驾驶技术的研发竞赛的节奏变得越来越快落后的玩家只能面对越来越高的门槛后发制人的可能性会逐渐变小。
本文为汽车像素(autopix)原创内容,未经授权,请勿转载。
(注:对文中涉及的智能驾驶技术及其细节,需要专业人士进行审慎评估和核实。)