中国通讯社-理想汽车VLA司机大模型从动物进化到人类在成长中持续解决行业问题

理想汽车VLA司机大模型从动物进化到人类在成长中持续解决行业问题

中国网汽车 2025-05-08

核心观点：

AI分为信息工具、辅助工具和生产工具三个层级，VLA司机大模型成为交通领域专业的生产工具；

规则算法是“昆虫动物智能”，端到端模型是“哺乳动物智能”，VLA司机大模型是“人类智能”；

VLA司机大模型通过预训练、后训练和强化训练，模拟人类学习驾驶的过程，确保模型带来舒适性、安全性的体验；

用户通过自然语言与司机Agent沟通，跟人怎么说，就跟司机Agent怎么说；

超级对齐规范司机Agent的职业性，世界模型解决模型的黑盒问题；

构建能力的过程包括研究、研发、能力表达、能力变成业务的价值四个步骤，第一步的“研究”是理想汽车最重要的投入；

DeepSeek助力VLA司机大模型研发加速，理想汽车开源自研汽车操作系统回馈社会；

成为更有能量的人，关键在于关注自我，接受自身的优点和不足，并用成长替代改变。

2025年5月7日，理想汽车推出“理想AI Talk第二季——理想VLA司机大模型，从动物进化到人类”，理想汽车董事长兼CEO李想重点分享了对于人工智能的最新思考，VLA司机大模型的作用、训练方法和挑战，以及对于创业和个人成长的见解。

李想将AI工具分为三个层级，分别是信息工具、辅助工具和生产工具。目前，大多数人将AI作为信息工具使用，但信息工具常伴随大量无效信息、无效结果和无效结论，仅具参考价值。成为辅助工具后，AI可以提升效率，例如现在的辅助驾驶，但仍需人类参与。未来，AI发展为生产工具后，将能独立完成专业任务，显著提升效率与质量。

李想表示：“判断Agent(智能体)是否真正智能，关键在于它是否成为生产工具。只有当人工智能变成生产工具，才是其真正爆发的时刻。就像人类会雇佣司机，人工智能技术最终也会承担类似职责，成为真正的生产工具。”

VLA的实现不是突变的过程，是进化的过程

目前的L2、L2+组合驾驶辅助仍属于辅助工具阶段，而VLA(Vision-Language-Action Model，视觉语言行动模型)能够让AI真正成为司机，成为交通领域的专业生产工具。对理想汽车而言，未来的VLA就是一个像人类司机一样工作的司机大模型”。

VLA的实现不是一个突变的过程，是进化的过程，经历了三个阶段，对应理想汽车辅助驾驶的昨天、今天和明天。第一阶段，理想汽车自2021年起自研依赖规则算法和高精地图的辅助驾驶，类似“昆虫动物智能”。第二阶段，理想汽车自2023年起研究，并于2024年正式推送的端到端+VLM(Vision Language Model，视觉语言模型)辅助驾驶，接近“哺乳动物智能”。

端到端模型在处理复杂问题时存在局限，虽可借助VLM视觉语言模型辅助，但VLM使用开源模型，使其在交通领域的能力有限。同时端到端模型也难以与人类沟通。为了解决这些问题并提升用户的智能体验，理想汽车自2024年起开展VLA研究，并在多项顶级学术会议上发表论文，夯实了理论基础。

在端到端的基础上，到第三阶段，VLA将开启“人类智能”的阶段。它能通过3D和2D视觉的组合，完整地看到物理世界，而不像VLM仅能解析2D图像。同时，VLA拥有完整的脑系统，具备语言、CoT(Chain of Thought，思维链)推理能力，既能看，也能理解并真正执行行动，符合人类的运作方式。

VLA训练过程模拟人类学习，对齐人类价值观

VLA的训练分为预训练、后训练和强化训练三个环节，类似于人类学习驾驶技能的过程。预训练相当于人类学习物理世界和交通领域的常识，通过大量高清2D和3D Vision(视觉)数据、交通相关的Language(语言)语料，以及与物理世界相关的VL(Vision-Language，视觉和语言)联合数据，训练出云端的VL基座模型，并通过蒸馏转化为在车端高效运行的端侧模型。

后训练相当于人类去驾校学习开车的过程。随着Action(动作)数据的加入——即对周围环境和自车驾驶行为的编码，VL基座变为VLA司机大模型。得益于短链条的CoT，以及Diffusion扩散模型对于他车轨迹和环境的预测，VLA具备实时性的特点，实现了在复杂交通环境中的博弈能力。

强化训练类似于人类在社会中实际开车练习，目标是让VLA司机大模型更加安全、舒适，对齐人类价值观，甚至超越人类驾驶水平。强化训练包含两部分：一是通过RLHF(Reinforcement Learning from Human Feedback，基于人类反馈的强化学习)完成安全对齐，使模型遵守交通规则，贴合中国用户的驾驶习惯；二是将纯强化学习模型放入世界模型中训练，提升舒适性，避免碰撞事故，遵守交通规则。经过预训练、后训练和强化训练后，VLA司机大模型即可部署至车端运行。

VLA司机大模型以“司机Agent(智能体)”的产品形态呈现，用户可通过自然语言与司机Agent沟通，跟人类司机怎么说，就跟司机Agent怎么说。简单通用的短指令由端侧的VLA直接处理，复杂指令则先由云端的VL基座模型解析，再交由VLA处理。

超级对齐确保AI决策安全，世界模型破解AI黑盒难题

除了提升专业能力，VLA司机大模型还需解决安全性和模型黑盒的问题。

模型能力越强，越需要职业性约束，以确保能力下限。为了保障VLA司机大模型能够实现职业司机般的安全和舒适，避免学习加塞等违规行为，理想汽车在强化训练环节投入大量资源，并于2024年底组建超过100人的超级对齐团队，相当于为司机Agent注入职业素养。

为解决模型的黑盒问题，理想汽车结合重建和生成两种路径，打造了真实、符合物理世界规律的世界模型，覆盖所有交通参与者和要素。基于世界模型的仿真能力，VLA可以在世界模型中低成本、准确地验证现实问题，提升解决问题的效率，有效应对模型黑盒带来的挑战。

判断司机Agent是否是个好司机，有三个关键标准：专业能力、职业能力和构建信任的能力。VLA司机大模型提升了专业能力，超级对齐增强了职业能力，VLA通过理解自然语言、具备记忆能力提升了构建信任的能力。

人工智能时代，扎实的基本功比走捷径重要

理想汽车实现技术快速跃迁的背后，是从研究、研发到能力表达，再到将能力变成业务价值的基本功积累。研究是关键，研究突破后，研发的效率会大幅提升，且注重价值转化，最终实现业务落地。

理想汽车坚持自研，通过技术赋能用户价值。例如，在辅助驾驶方面，由于英伟达Orin-X芯片无法直接运行语言模型，端到端+VLM的辅助驾驶方案对部分企业来说仍具挑战。理想汽车依托自有编译团队，自研底层推理引擎，使芯片可通过INT4(4比特整型)量化的方式运行VLM。同时，凭借芯片、控制器设计和自研汽车操作系统等综合能力，理想汽车实现了让双Orin-X芯片和Thor-U芯片运行同等规模的VLA司机大模型。李想表示，大型企业的基本功和能力永远无法被逾越。

得益于DeepSeek的开源，理想汽车在VLA司机大模型的语言能力研发上提速显著，节省了近9个月的时间和数亿元成本。尽管如此，理想汽车仍选择加大投入，在基座模型上投入超预期3倍的训练卡，专注打造适配多场景的自研模型。李想表示：“我们可以站在巨人的肩膀上，但它只是其中的一部分。”在受益开源的同时，理想汽车也选择开源自研的汽车操作系统——理想星环OS，回馈社会。

成长带来能量，在痛苦中保持正能量

今年7月，理想汽车将迎来成立十周年。李想表示，创业路上苦多于甜，他选择保留那些有价值的美好片段，用来激励自己保持正能量。“创业确实不容易，但是没必要苦哈哈的。苦和甜是一个硬币的正反面，取决于看哪一面。”他将企业遭遇的打击视为必须面对的挑战，也正是这些挑战，赋予了理想汽车更多的能力。也正因这份积极乐观的创业心态，理想汽车才能快速成长为千亿营收规模、百万交付量的新势力企业。

谈及如何成为更有能量的人，李想认为，关键在于关注自我，接受自身的优点和不足，并用成长替代改变——成长意味着增强能力。除此之外，李想强调亲密关系同样重要，关注他人的成长也能带来能量，家人和同事能够和他形成互补，相互支撑。“我需要家人和同事甚至超过了他们需要我，首先是我需要他们，然后才是他们需要我，我们在一起能够形成非常强的脑力和心力。”李想表示。

回顾几次创业经历，李想表示，从高中创办个人网站至今，自己的思维方式没有什么变化：遇到问题解决问题，解决别人不愿解决的难题，解决用户的痛点，不断向他人学习。不同的是，如今面临的问题更复杂、服务的用户群体更多、公司规模和组织也更庞大。“几次创业一路走来，最难时有人相助，遇坑也能迅速爬出，一帮人齐心协力变得更好，这是种幸运，也没什么可后悔的。”

面对AI的发展，李想认为，在AI面前所有的人性都应被保留，无论好坏，因为一切人性都是文化、生命、性格、能力的特质，也是人类真正的生命力所在。

从使用增程电动和5C超充技术解决电池成本高、充电难、充电慢的问题，到自研汽车操作系统攻克传统汽车操作系统性能差、开发缓慢、芯片匹配周期长等挑战，理想汽车始终以技术创新解决行业无法解决的问题。自研VLA时，理想汽车更是踏入了人工智能的无人区。当前，辅助驾驶走到了新的十字路口上，理想汽车将不断挑战成长的极限，持续为行业和用户创造价值。

理想汽车VLA司机大模型从动物进化到人类在成长中持续解决行业问题

热点新闻

11名苏丹籍难民在利比亚沙漠中因脱水死亡

俄罗斯发射一颗军用卫星

美法官阻止政府终止国际学生身份措施生效

为扩大“蓝碳”规模日本将开展深海藻类生物调查

美媒揭批大规模减税法案提醒美国民众：“除非你非常富有否则将过得更糟”

国际观察｜众议院涉险过关美减税法案争议难平

哈佛大学称已就美政府对国际学生的禁令提起诉讼

巴基斯坦延长对印度航班关闭领空至6月24日

俄乌完成直接会谈后首批大规模换俘

新加坡新一届内阁宣誓就职

特朗普提议对欧盟征收50%关税欧美股市大幅低开

40歲女子倒斃樂華北邨單位　3歲女兒被送院檢查

精彩推荐

2025香港國際法律服務大會探討「跨法域鏈全球」新格局

惠譽維持香港AA-信用評級　政府：肯定了香港強勁信貸基本面

中學校際高球賽參賽學校數目創新高　助推高球運動普及化

民政事務總署開放19間臨時避暑中心

紐約電視電影節公布得獎名單　TVB 6項提名全數得獎

警方調查青衣南灣隧道入口致命意外　運輸署稱工作人員有穿反光衣

總商會：難判斷關稅戰最壞時間是否過去　強調本港經濟基調良好

陳美寶與港鐵管理層會面　敦促全面為整個鐵路網絡作風險評估

許正宇：公司遷冊機制並無特別針對哪個行業

樂華北邨3歲女童伴母屍4天學校老師多次跟進本打算今日再家訪

陳國基實地考察「八一九銀礦灣大屠殺」歷史現場

「I SEE·I KNOW」香港青年認知祖國系列活動　近50名港青到訪長慶油田

「北部都會區論壇 -深港協作篇」順利舉辦　深港協作促進北部都會區發展

打鼓嶺貨倉起火塑膠廢料焚燒冒煙

德適生物醫學AI模型　提升影像診斷能力

外交部：已就日本抓扣台湾渔船向日方提出严正交涉

外交部：奉劝美方不要再利用菲律宾在南海挑事

国家金融监督管理总局有关司局负责人就《银行保险机构资产管理产品信息披露管理办法（征求意见稿）》答记者问

国家金融监督管理总局就《银行保险机构资产管理产品信息披露管理办法（征求意见稿）》公开征求意见

5148.3万件、1432.6亿元，补贴购新消费火热！消费结构向中高端跃迁

从“单打独斗”到“共赢共富” 特色产业创新发展蝶变成“金招牌”

习近平同德国总理默茨通电话

应急管理部公布一批化工非法生产典型案例

习近平向罗马尼亚当选总统达恩致贺电

理想汽车VLA司机大模型 从动物进化到人类 在成长中持续解决行业问题

热点新闻

11名苏丹籍难民在利比亚沙漠中因脱水死亡

俄罗斯发射一颗军用卫星

美法官阻止政府终止国际学生身份措施生效

为扩大“蓝碳”规模 日本将开展深海藻类生物调查

美媒揭批大规模减税法案 提醒美国民众：“除非你非常富有 否则将过得更糟”

国际观察｜众议院涉险过关 美减税法案争议难平

哈佛大学称已就美政府对国际学生的禁令提起诉讼

巴基斯坦延长对印度航班关闭领空至6月24日

俄乌完成直接会谈后首批大规模换俘

新加坡新一届内阁宣誓就职

特朗普提议对欧盟征收50%关税 欧美股市大幅低开

40歲女子倒斃樂華北邨單位 3歲女兒被送院檢查

精彩推荐

2025香港國際法律服務大會探討「跨法域 鏈全球」新格局

惠譽維持香港AA-信用評級 政府：肯定了香港強勁信貸基本面

中學校際高球賽參賽學校數目創新高 助推高球運動普及化

民政事務總署開放19間臨時避暑中心

紐約電視電影節公布得獎名單 TVB 6項提名全數得獎

警方調查青衣南灣隧道入口致命意外 運輸署稱工作人員有穿反光衣

總商會：難判斷關稅戰最壞時間是否過去 強調本港經濟基調良好

陳美寶與港鐵管理層會面 敦促全面為整個鐵路網絡作風險評估

許正宇：公司遷冊機制並無特別針對哪個行業

樂華北邨3歲女童伴母屍4天 學校老師多次跟進本打算今日再家訪

陳國基實地考察「八一九銀礦灣大屠殺」歷史現場

「I SEE·I KNOW」香港青年認知祖國系列活動 近50名港青到訪長慶油田

「北部都會區論壇 -深港協作篇」順利舉辦 深港協作促進北部都會區發展

打鼓嶺貨倉起火 塑膠廢料焚燒冒煙

德適生物醫學AI模型 提升影像診斷能力

外交部：已就日本抓扣台湾渔船向日方提出严正交涉

外交部：奉劝美方不要再利用菲律宾在南海挑事

国家金融监督管理总局有关司局负责人就《银行保险机构资产管理产品信息披露管理办法（征求意见稿）》答记者问

国家金融监督管理总局就《银行保险机构资产管理产品信息披露管理办法（征求意见稿）》公开征求意见

5148.3万件、1432.6亿元，补贴购新消费火热！消费结构向中高端跃迁

从“单打独斗”到“共赢共富” 特色产业创新发展蝶变成“金招牌”

习近平同德国总理默茨通电话

应急管理部公布一批化工非法生产典型案例

习近平向罗马尼亚当选总统达恩致贺电

理想汽车VLA司机大模型从动物进化到人类在成长中持续解决行业问题

为扩大“蓝碳”规模日本将开展深海藻类生物调查

美媒揭批大规模减税法案提醒美国民众：“除非你非常富有否则将过得更糟”

国际观察｜众议院涉险过关美减税法案争议难平

特朗普提议对欧盟征收50%关税欧美股市大幅低开

40歲女子倒斃樂華北邨單位　3歲女兒被送院檢查

2025香港國際法律服務大會探討「跨法域鏈全球」新格局

惠譽維持香港AA-信用評級　政府：肯定了香港強勁信貸基本面

中學校際高球賽參賽學校數目創新高　助推高球運動普及化

紐約電視電影節公布得獎名單　TVB 6項提名全數得獎

警方調查青衣南灣隧道入口致命意外　運輸署稱工作人員有穿反光衣

總商會：難判斷關稅戰最壞時間是否過去　強調本港經濟基調良好

陳美寶與港鐵管理層會面　敦促全面為整個鐵路網絡作風險評估

樂華北邨3歲女童伴母屍4天學校老師多次跟進本打算今日再家訪

「I SEE·I KNOW」香港青年認知祖國系列活動　近50名港青到訪長慶油田

「北部都會區論壇 -深港協作篇」順利舉辦　深港協作促進北部都會區發展

打鼓嶺貨倉起火塑膠廢料焚燒冒煙

德適生物醫學AI模型　提升影像診斷能力