李想布局人工智能:打造 “司机 Agent” 开启智能驾驶新时代

五个月前,李想宣布理想 All in AI,致力于从智能汽车公司转型为人工智能科技公司,并推出了全新的 VLA(Vision – Language – Action)模型,引发行业广泛关注。
李想布局人工智能:打造 “司机 Agent” 开启智能驾驶新时代

李想布局人工智能:打造 “司机 Agent” 开启智能驾驶新时代

理想汽车在智能化领域的探索由来已久,2025 年产品的核心聚焦于智能化升级。李想对理想的智驾原创性给予高度评价,认为其重要性甚至超越了增程技术。而 VLA 模型作为理想在辅助驾驶领域的最新成果,被李想寄予厚望,他期望其能像人类司机一样工作并创造商业价值。
在实际演示中,VLA 所展现的 “司机 Agent” 功能令人惊艳,具备出色的辅助驾驶能力,还能通过语音与人类驾驶员高效交互。例如在高速收费站,可按指令从 ETC 转向人工通道;日常驾驶和泊车时,也能依据简单指令调整行车或泊车路线,达到与网约车或代驾司机沟通的水平。
辅助驾驶的发展历程经历了模块化方案、端到端感知、VLM+E2E 等阶段,如今来到 VLA 这一新十字路口。李想认为辅助驾驶正处在 “黎明前的黑暗”,即将迎来曙光。VLA 模型最早由 Google DeepMind 提出用于机器人控制,理想汽车在此基础上进行研发。李想强调 VLA 的诞生是进化的结果,其训练过程类似人类学开车,包括预训练、后训练、强化训练等步骤,最终形成能接收摄像头数据和语言指令并输出控制信号的 “司机大模型”。
理想汽车还设计了 “司机 Agent”,让用户可通过自然语言向车下达指令,由 Agent 传达给 VLA 执行。不过,李想也指出 VLA 虽有能力解决全自动驾驶,但未来可能还有更高效架构,其对算力要求较高,或许并非终极解决方案。
DeepSeek 的出现加速了理想在 AI 领域的研发进程。理想原计划今年 9 月推出语音模型,DeepSeek R1 模型的开源让理想决定以此为基础加速 VLA 研发,并研究在芯片上提升训练和推理效率。受 DeepSeek 开源精神鼓舞,理想开源了自研四年的整车操作系统 —— 理想星环 OS。目前理想正在训练两个基座大模型,分别用于 “理想同学” App 和 VLA 模型训练基座。
李想将 VLA 模型视为无人区探索,与通用语言模型最大不同在于需加入视觉和语言联合语料训练。他将 DeepSeek 的出现比作 Linux 推出,期望理想能追逐人工智能的 “安卓时刻”,在垂直领域训练专用大模型提升 AI 能力。
尽管李想认为目前特斯拉 FSD 在国内模型水平不代表其实力,但依然肯定其基本功扎实,是理想学习的对象。他强调在内卷环境下更要重视基本功积累,否则创新难以为继,而人工智能正是理想当下大力投入的方向。
版权声明:AI工具箱导航 发表于 2025-05-09 18:13:01。
转载请务必标明出处:李想布局人工智能:打造 “司机 Agent” 开启智能驾驶新时代 | AI工具箱导航