作为我们关于特斯拉专利系列的延续,我们将研究特斯拉如何优化自动驾驶汽车和机器人中人工智能(在本例中为 FSD)的性能。
专利 WO2024073115A1 介绍了如何在专用硬件上高效运行复杂的人工智能模型。
在深入研究本文之前,我们建议您阅读我们关于 FSD 工作原理的文章和我们关于特斯拉通用翻译器的另一篇文章,以简化 FSD部署。
虽然它们不是必需的,但背景知识将帮助您了解特斯拉如何进行优化背后的所有细节。
就像以前一样,我们将把它分成几个部分,并使它们尽可能容易理解。
AI 子网络
FSD 并不是一个整体实体——它由较小的专用子网络组成,每个子网络都专用于自动驾驶的特定方面或功能。
这种模块化设计意味着特斯拉可以通过训练来改进一个或所有部分。
当一个部分得到改进时,人工智能的端到端特性也意味着其他部分将学会适应改进,从而表现得更好。
它还允许在部署和初始平台训练期间实现更高效的处理和适应性。
这些子网络可能负责以下任务:
1、识别和解释交通信号。
2、检测和跟踪移动物体,包括车辆、行人、自行车等。
3、保持车道位置并行驶道路。
4、生成周围环境的 3D 地图。
5、规划路径并做出实时驾驶决策。
这种分工使 FSD 能够更高效、更精确地处理自动驾驶的复杂性。
定制编译器
不同的硬件组件擅长不同的功能 – 而且它们也需要不同类型的指令。CPU、GPU 和专用 AI 加速器 (NPU) 都具有独特的架构和功能。
特斯拉使用编译器工具链将 FSD 转换为针对每个硬件组件量身定制的机器代码。这可确保指令在每个处理器上以最佳方式执行,从而最大限度地提高性能和效率。
任务分配
为了进一步优化性能,特斯拉采用了一种系统,可以智能地将每个 FSD 子网络分配给最合适的硬件组件。
这确保计算要求高的任务由最强大的处理器处理,而较简单的任务则委托给更高效的单元。
这种战略性的任务分配最大限度地提高了系统的整体效率,确保每个组件都在其最佳性能范围内运行。
优化调度
硬件执行指令的顺序对性能也起着至关重要的作用。
特斯拉的系统包括一个“执行调度程序”,它可以确定最有效的操作顺序,最大限度地减少延迟,最大限度地提高实时响应能力。
这种优化的调度确保 FSD 能够在动态驾驶情况下(或者在 Optimus 的帮助下快速响应情况,例如接球)快速做出反应并做出明智的决策。
量化感知训练
为了减少 FSD 的计算负担和功耗,特斯拉采用了一种称为“量化感知训练”的技术。
这涉及训练 FSD 处理精度较低的数字,这需要较少的处理能力和内存。本质上就是四舍五入。
这种方法使得人工智能能够高效运行,而不会显著影响准确性,从而在性能和资源利用率之间取得平衡。
时钟同步
在具有多个芯片的硬件系统中,保持精确的计时对于准确和同步的操作至关重要。
特斯拉的系统采用了同步所有处理单元时钟的机制,防止计时错误并确保不同组件之间的无缝协调。
这种精确的时钟同步对于 FSD 进行准确的实时计算和有效应对不断变化的条件至关重要。
冗余和故障转移
为确保可靠性和安全性,特斯拉的系统支持冗余硬件配置。这意味着,如果关键组件发生故障,备用组件可以无缝接管,防止运行中断。
这种冗余和故障转移功能对于维护自动驾驶系统的安全性和完整性至关重要,尤其是在驾驶时。
特斯拉为 FSD 内置了物理和软件冗余,确保其在自动驾驶时保持最低安全标准。
简而言之
想象一下一家大型公司(FSD),它拥有不同的部门(子网络)负责特定任务。每个部门都有自己的专用工具和设备(硬件组件)。
特斯拉的系统就像一个高效的管理结构,将正确的任务分配给正确的部门,为他们提供适当的工具,并协调他们的努力以实现最佳生产力和绩效。
官方小程序/公众号 ——「特来讯」;最实用的购车技巧,最优惠的购车利率,最温情的车友互助群,请微信联系小助手 teslaside2024。特来讯读者可扫码加入读者群。
原创文章,作者:特来讯,如若转载,请注明出处:https://teslaside.com/news/21767/