李想布局人工智能：打造 “司机 Agent” 开启智能驾驶新时代

AI快讯 23小时前 AI工具箱导航

0 0

五个月前，李想宣布理想 All in AI，致力于从智能汽车公司转型为人工智能科技公司，并推出了全新的 VLA（Vision – Language – Action）模型，引发行业广泛关注。

理想汽车在智能化领域的探索由来已久，2025 年产品的核心聚焦于智能化升级。李想对理想的智驾原创性给予高度评价，认为其重要性甚至超越了增程技术。而 VLA 模型作为理想在辅助驾驶领域的最新成果，被李想寄予厚望，他期望其能像人类司机一样工作并创造商业价值。

在实际演示中，VLA 所展现的 “司机 Agent” 功能令人惊艳，具备出色的辅助驾驶能力，还能通过语音与人类驾驶员高效交互。例如在高速收费站，可按指令从 ETC 转向人工通道；日常驾驶和泊车时，也能依据简单指令调整行车或泊车路线，达到与网约车或代驾司机沟通的水平。

辅助驾驶的发展历程经历了模块化方案、端到端感知、VLM+E2E 等阶段，如今来到 VLA 这一新十字路口。李想认为辅助驾驶正处在 “黎明前的黑暗”，即将迎来曙光。VLA 模型最早由 Google DeepMind 提出用于机器人控制，理想汽车在此基础上进行研发。李想强调 VLA 的诞生是进化的结果，其训练过程类似人类学开车，包括预训练、后训练、强化训练等步骤，最终形成能接收摄像头数据和语言指令并输出控制信号的 “司机大模型”。

理想汽车还设计了 “司机 Agent”，让用户可通过自然语言向车下达指令，由 Agent 传达给 VLA 执行。不过，李想也指出 VLA 虽有能力解决全自动驾驶，但未来可能还有更高效架构，其对算力要求较高，或许并非终极解决方案。

DeepSeek 的出现加速了理想在 AI 领域的研发进程。理想原计划今年 9 月推出语音模型，DeepSeek R1 模型的开源让理想决定以此为基础加速 VLA 研发，并研究在芯片上提升训练和推理效率。受 DeepSeek 开源精神鼓舞，理想开源了自研四年的整车操作系统 —— 理想星环 OS。目前理想正在训练两个基座大模型，分别用于 “理想同学” App 和 VLA 模型训练基座。

李想将 VLA 模型视为无人区探索，与通用语言模型最大不同在于需加入视觉和语言联合语料训练。他将 DeepSeek 的出现比作 Linux 推出，期望理想能追逐人工智能的 “安卓时刻”，在垂直领域训练专用大模型提升 AI 能力。

尽管李想认为目前特斯拉 FSD 在国内模型水平不代表其实力，但依然肯定其基本功扎实，是理想学习的对象。他强调在内卷环境下更要重视基本功积累，否则创新难以为继，而人工智能正是理想当下大力投入的方向。

AI资讯

版权声明：AI工具箱导航发表于 2025-05-09 18:13:01。
转载请务必标明出处：李想布局人工智能：打造 “司机 Agent” 开启智能驾驶新时代 | AI工具箱导航

李想布局人工智能：打造 “司机 Agent” 开启智能驾驶新时代

中兴通讯 Co - Sight 超级智能体引爆 GAIA 开源榜，登顶第一

腾讯混元视频生成工具开源：开启创意视频新时代