雷火·竞技-世界模型，是自动驾驶的终极答案吗？

首页财产阐发评论主动驾驶正文世界模子，是主动驾驶的最终谜底吗？已往两三年车企谈智驾常说起世界模子，其素质是再造真实世界，今朝仅运用在云端，还没有装车，算法未成熟，存于“幻觉”问题。 2026-02-06 10:47 ·36氪肖漫肖漫 AI投资人解读· 智驾行业中，世界模子受浩繁公司存眷，被视为“物理世界AI”要害拼图，能解决端到端模子测试、验证问题，晋升智驾模子效果。 · 世界模子算法尚不可熟，存于“幻象”危害，数据质量影响模子天生质量，间隔抱负状况的仿真器仍有差距，今朝多运用在云端。总结：世界模子于智驾范畴有成长潜力，但算法未冲破，运用局限在云端，存于危害。投资时需存眷技能进展与危害，评估其对于智驾行业的持久影响。内容由AI天生，仅供参考

已往两三年，车企谈智驾必说起各种新奇的技能名词。

世界模子是继端到端、 VLA 后，智驾范畴最时兴的词。差别公司还有给它套上新的外壳——小鹏推出了“世界基座模子”、蔚来的叫“端到端世界模子”、华为的叫“世界举动模子”（WA）。除了了他们，地平线、抱负、元戎启行、Momenta也于做世界模子。

但只看他们的发布会，很难分清它们口中的世界模子究竟是不是统一种工具？它毕竟解决甚么问题，又被放进智能驾驶架构的哪个位置？

把视角拉到更广义的语境里，“世界模子”素质是于虚拟世界里再造真实世界，人工智能能像人同样理解实际世界，认知物理纪律、事物的因果瓜葛及情况动态的技能。

世界模子被年夜部门科学家及科技公司视为“物理世界 AI”技能远征的要害拼图。斯坦福年夜学传授李飞飞认为，空间智能是AI的下一个十年，而世界模子是构建空间智能的要害技能。

走于行业前沿的科学家及科技公司还有于摸索傍边，但中国汽车行业已经经用各类新奇的观点名词把位置占住。

现实上，智驾行业里今天谈的“世界模子”也只是名词差异，于技能路径上并无太年夜不同。只是对于行业本来的仿真东西举行技能范式进级，于还有原度更高、颗粒度更高、场景更富厚、自由度更高的虚拟世界中，解决端到端模子测试、验证问题，这一切都是为了练习出效果更高、越发拟人的端到端智驾模子。

换句话说，智驾厂商及车企并不是真正打造一个完备的数字物理世界，只是用世界模子的思绪造仿真器。

或许各家对于在世界模子的期待有所差别，但据咱们相识，截至今朝，智驾行业的世界模子只运用在云端，并无用到汽车上。

「端到端普和，凸显仿真器短板」

已往两三年，头部梯队的智驾方案从法则栈转向AI驱动，于“情势上”完成为了同一，感知、猜测、计划被尽可能揉进一张收集里，外加更年夜的模子、更高的算力，用车企常于发布会上的话说“端到端以后的智驾更像人于开车”。

但于现实运用上却呈现了一个反直觉征象：端到端以后的新版本OTA其实不必然变患上更好，甚至可能“退步”。

问题的焦点不是模子变差了，而是AI驱动让评估及回归变患上坚苦。

其时很多智驾从业者认为，只要把前端练习患上充足好，车就会开患上充足像人。这条路径并不是没有用果，端到真个前期体现让很多智驾从业者年夜为震撼，但端到真个“黑盒”形态也带来的副作用，当模子堕落时，研发职员很可贵知为何犯错？怎样证实它于下一次不会再犯？

模子好欠好再也不只是“练习患上够不敷年夜、数据够不敷多”的问题，更取决在你怎样发明问题、界说问题、验证问题。厂商们逐渐意想到，需要一个更好的仿真器于模子验证阶段用来评估模子的体现。

头部梯队玩家多数打造世界模子作为仿真器运用。为了可以或许让抱负VLA于仿真情况里举行强化进修，抱负于2025年提出了一种包罗自车及他车轨迹的驾驶世界模子，充任打分教员；小鹏只管对于外只说了“世界基座模子”这一素质上世界模子无关的技能名词，但据36氪汽车相识，小鹏也于采用世界模子做仿真测试，评测新版本的模子算法能力。

端到真个普和袒露出传统仿真器的短板。“之前端到端还有不是这么普和的时辰，各人验证成本也没那末高，还有可以分段去验证一下体系。此刻端到端了之后，无法分段验证体系了，这个时辰仿真器的问题就凸显出来了。”一名业内研发职员说道。

于法则时代，车企做仿真往往办事在两件事，一是半路接受的问题重现，把路测里出过事的片断拿回往返放；二是的利用仿真器增长corner case的数据富厚度，于模仿器里搭几个典型路口、横穿行人、加塞车辆的剧本场景，让体系跑一遍。

其时的仿真器更多负担“放年夜镜”的脚色，但端到端以后，模子很难再把责任拆开，且很难体系性地孕育发生更细的、可控的 corner case，更难支撑端到端所需要的年夜范围闭环验证——而这恰是世界模子被引入的缘故原由。

「端到端时代，世界模子是智驾模子的“锻练”」

“今朝海内车企世界模子的程度及特斯拉存于必然间隔，不外仅相差了不到一年时间。”一名业内子士说道。

特斯拉并未利用“世界模子”的观点，而是采用了“世界模仿器”的说法（特斯拉主动驾驶副总裁Ashok Elluswamy于去年的ICCV上初次说起），该模仿器基在特斯拉自建的海量数据集举行练习，按照当前状况与下一步动作天生将来状况。从而与车真个端到端基础模子闭环，做真实效果的评估。

一名业内子士指出，特斯拉更像是于用神经收集“拟合”世界，衬着历程是经由过程计较天生，只管即便削减显式的物理法则重叠；素材库也并不是彻底由人提早预界说，而是保留了某种几率权重与组合空间。而这么做的利益是，模子可以或许具有更强的泛化能力。

海内车企走的可能是另外一条更“可控”的路。与36氪汽车交流的一家供给商暗示，抱负采用的是 3D 高斯重修——这也是今朝年夜大都车企于采用的方式之一。

不管是哪一种线路，世界模子于工程上终极都指向统一个位置：世界模子正于被车企看成端到端时代的“验证与反证体系”，用来于云端重放、改写、扩增实际驾驶中可能发生的情境，查验车端年夜模子的输出是否不变、可复现，并把“哪里错、为何错”从头酿成可追踪的证据链。

世界模子饰演的脚色比如锻练员，优异的锻练员更可以或许调教出优异的运带动。“跟着云端世界模子愈来愈强，理论上练习出来端侧模子能力就应该是愈来愈强。”一名研发职员说道。

世界模子焦点能力重要有两个方面：一是对于物理世界的数字化建模及抽象；二是基在如许的建模，孕育发生对于物理世界合理的想象及猜测，例如经由过程给定的图片猜测将来世界将会怎样变化。

世界模子的优劣取决在就是于云端能天生充足真实、充足多样性的数据。“车企假如只是用采到的真实数据去做仿真，那显然其实不是于做世界模子，只是做一套回放数据的流程罢了。”一名供给商产物司理说道。

世界模子需要从物理世界的数据中进修到世界的运行模式，是以世界模子的练习数据质量会显著影响模子天生的质量。极佳视界产物线卖力人毛继明提到，“对于在世界模子如许的天生模子，它的天生成果终极会对于齐输入数据的特性漫衍纪律。于真正的世界模子贸易化历程中咱们发明，假如数据质量只有60分，基在此的世界模子的天生数据质量可能就只有55分。”

基在世界模子，车企于云端做仿真的时辰，可以无穷制的从各个维度去去天生需要的场景，可以或许按照指令天生视频作为练习数据。“效率比真实收罗后再去练习高了不是一星半点，模子迭代速率也会是断代式领先。”一名供给商研发职员说道。

但这些都是抱负化的成果。“世界模子相对于在智驾用的仿真器来讲，或者者说没有仿真信息，只能用离线采的数据来做验证已经经是很年夜的进级了，但间隔抱负状况的仿真器还有差患上多。”

「世界模子算法还有未成熟，还有有许多“幻觉”」

行业此刻遍及处于“刚最先”的阶段。

一名车企研发职员告诉36氪汽车，海内厂商基在世界模子最长能天生30-60秒视频片断，但动态物体的一致性其实不好，不管是时空的一致性还有是多视角一致性都存于较年夜问题。

世界模子的底层是天生式模子，而天生式模子生成带着“幻象”的危害。“世界模子今朝最难之处是怎么能包管天生的工具是真正的，假如是天生一小我私家，怎么包管他的举动、轨迹是于真实世界里可能发生的。”一名供给商产物司理说道。“假如世界模子天生庞杂，会致使模子学到的工具都是错的，进而致使到部署到车真个模子效果很是差。”

一个极度的例子是，假如云端天生的车都是横着走的，那模就会认为一个于左前方的车会刹时挪动到右前方，于现实开车的历程中，模子就可能做出刹车的举动。

一个仿真器假如没法迫近实际世界的要害因果瓜葛，好比湿滑路面临制动间隔的影响、逆光下对于静止物体的误检几率、并线时对于方车辆的博弈计谋等，它天生的“corner case”就多是假的；你于假问题上优化，等在把研发资源华侈于幻影上。

于许多人看来，世界模子的瓶颈于数据与算力，但前抱负汽车辅助驾驶“端到端”模子卖力人夏中谱更赞成Lecun的不雅点：“世界模子算法层面没有年夜冲破，图象模子的自监视练习还有没有像语言那样，找到一个比力顺的范式。”

语言模子之以是能迅速范围化，一个缘故原由是语言自己信息密度高，每一个词都携带明确的语义约束。而图象信息密度低，对于“驾驶决议计划”而言，有效信息只占极小部门。

例如，模子不需要猜测正后方很远那辆车的轨迹，也不需要猜测远处修建物的变化，这些都是噪声数据；但必需猜测本车道前车是否会忽然急刹、旁车是否会抢道、行人是否会忽然横穿，模子要先知道“该把留意力放于哪”。

“今朝智驾算法提取不出充足对于驾驶有效的图象信息。”夏中谱说道。一张图象有可能有上百万个像素点，但跟决议计划相干的就20多个像素点，其他的都是噪音，模子患上先学会从噪声里抓出那 1‰ 甚至 1‱ 的有用旌旗灯号，再谈患上上怎样把旌旗灯号构造成可用在推理与猜测的布局。

夏中谱看来，世界模子算法还没有冲破，更谈不上数据是否充足、算力需要几多的问题。也恰是世界模子此刻基础技能还有没看到明确冲破，车企的投入更可能是研究性子的，甚至部门车企老板对于此都是苍茫。

假如世界模子做患上充足好，且于算力可以或许支撑的环境下，是可以或许放进车端。“海内此刻基本把世界模子当仿真体系用，对于智驾决议计划层面的技能理解水平还有不敷。”夏中谱说道。

它也能注释一个外貌抵牾：为何各家都于讲世界模子，但用户体感差异其实不较着——由于年夜大都人的世界模子仍逗留于“用在练习与验证”的第一阶段，而不是进入“能支撑决议计划计划”的第二阶段。

“端侧部署世界模子是最难的。”夏中谱说道。

今朝还有没有任何一家公司于端侧运用世界模子。他同时指出，“利用年夜模子要领建模物理世界，经由过程自身与物理世界的交互猜测世界成长变化，进而经由过程决议计划影响世界朝着对于自身有益标的目的成长。假如世界模子做到这个层面，主动驾驶及呆板人相干问题都是可以解决的。”

【本文由投资界互助伙伴36氪授权发布，本平台仅提供信息存储办事。】若有任何疑难，请接洽（editor@zero2ipo.com.cn）投资界处置惩罚。

-雷火·竞技