
我们曾在去年 11 月基于特斯拉的专利深入探讨过 FSD(全自动驾驶)的工作原理。近期,特斯拉又提交了关于 FSD 训练的新专利,题为「预测自动驾驶的三维特征」。
这项专利的核心是通过特斯拉视觉系统(Tesla Vision)建立「地面实况」(ground truth),使 FSD 能够基于此对环境进行决策和导航。
时间序列:环境理解的基础
FSD 通过「时间序列」(随时间变化的数据序列)来理解环境。
特斯拉视觉系统结合车辆内部传感器(速度、加速度、位置等)持续生成数据点,这些数据点构成时间序列。
通过分析时间序列,系统能建立高度精确的「地面实况」,包括道路特征、周围物体等信息。
例如,随着车辆移动,FSD会从多角度、多距离观察车道线,从而确定其精确的三维形状。
这一系统帮助FSD在行驶中保持对环境的连贯认知,即使某些物体最初被遮挡或模糊不清。
有趣的是,特斯拉专利中提到了除视觉系统外的其他传感器(如雷达、激光雷达和超声波传感器)。
尽管特斯拉目前未在量产车上使用雷达(尽管新款 Model S/X 配备了高清雷达)或超声波传感器,但激光雷达被用于训练阶段,以生成高精度传感器数据用于 FSD 训练。
特斯拉车辆本身并不搭载激光雷达。
关联地面实况
地面实况建立后,需与时间序列中的特定时间点(如单张图像或一组图像的合成)关联。这种关联至关重要——它让系统仅凭单帧图像即可预测环境的完整三维结构。
例如,若 FSD 通过时间序列数据确定了某条车道线的精确曲线,它会将此信息与图像序列中对应的画面关联,从而预测该车道线未来的三维形态。
结合预测能力与高精度地图数据,FSD 能更好地预判道路布局并提前规划动作。但实际路况(地面实况)始终优先于地图信息。
这也是为何当道路与地图不符时(如新增环岛替代原有四向停车路口),FSD 仍能安全通过。
三维特征与环境建模
系统需以三维形式呈现道路特征(如车道线的起伏、弯曲等),这对弯道、坡道等地形的精准导航至关重要。
特斯拉的 3D 建模还能预测其他移动物体的路径,辅助路径规划。
自动化训练数据生成
这一三维系统的核心优势是自动生成训练数据。
车辆行驶时收集的传感器数据与地面实况结合,形成时间序列。特斯拉通过超级计算机分析这些数据,持续优化机器学习模型的预测能力。
目前,特斯拉正逐步减少人工标注数据的依赖,转向AI自动标注。
语义标注
专利还提到「语义标注」(如将车道线标记为“左车道”或“右车道”),以及动态物体标签(如“并道”或“切入”)。这些标签帮助FSD优先处理关键信息并预判环境变化。
数据上传机制
特斯拉并非无差别收集所有数据,而是基于特定触发条件(如预测错误、用户干预或路径规划失败)选择性上传。
此外,特斯拉会根据车型和地理位置要求特定车辆上传数据(例如加拿大首批 Cybertruck 用户曾上传 1.28 TB数据)。
这种定向收集策略能高效获取特定驾驶场景的数据,优化模型泛化能力。
总结
FSD 通过时间序列构建车辆周围的三维环境模型,并基于此预测前方路况。这一过程为决策提供了核心上下文。
当然,FSD 的完整系统还包含更多层级,例如对移动/静止物体的识别、风险预测等。
若您对技术细节感兴趣,可继续阅读本系列的其他文章:
FSD 工作原理 第二部分(本文)。
我们将持续解析特斯拉专利,揭开 FSD 背后的技术逻辑。这不仅是了解车辆「硅基大脑」的窗口,也能一窥特斯拉工程师如何构建自动驾驶系统。

原创文章,作者:特来讯,如若转载,请注明出处:https://teslaside.com/news/22056/