【ZiDongHua 之驾驶自动化收录关键词:自动驾驶 人工智能 汽车驾驶自动化 NVIDIA 深度神经网络 】
 
 
  国际洞察:让自动驾驶汽车成为现实,AI 准备好了吗?
 
 
  来源:Digital Engineering
 
  作者:Tom Kevan
 
  编译:李兆荣
 
  自动驾驶汽车安全高效地将人员和货物运送到目的地的现实在很大程度上取决于汽车制造商如何利用AI(人工智能)的力量。AI的影响力已经跨越了自动驾驶汽车生命周期的整个领域,突破了设计、功能和性能的极限,但该行业要充分利用人工智能的优势并实现全面的驾驶自动化,还有很长的路要走。
 
  自动驾驶汽车可用的感知输入数量不断增加,这为更准确、更详细地理解运行环境提供了可能,但这些数据仍然无法提供满足安全要求所需的可见性。要应对应用的复杂性,并填补在物理力量作用下的信息缺口,将成为自动驾驶技术进一步发展的下一个里程碑。
 
  要想了解自动驾驶汽车的想法距离现实有多近,重要的是要了解AI的力量在哪里发挥作用,以及当前技术的实际效果如何。要做到这一点,让我们从研究AI对设计过程的基本工具和实践的影响开始。
 
 
 
  图 1:利用 AI,自动驾驶汽车开发团队可以使用物理上精确的模拟和 3D 环境来创建、测试和验证自动驾驶系统和服务的设计。图片由 NVIDIA 提供。
 
  ▍扩展数据基础
 
  AI系统驱动自动驾驶汽车技术的基本机制是算法。算法的创建始于收集大量高质量、有标签的物理数据。这些数据用于训练、测试和验证算法。
 
  Nauto工程总监Ben Alpert表示:“为了实现稳健可靠的AI系统,训练数据准确地代表现实世界的丰富性和多样性是很重要的。例如,数据集应该代表不同的环境条件,包括弱光或眩光之类的东西。”
 
  好消息是,该行业现在有许多 AI 软件开发工具,可以收集、标记、索引、存档和管理训练 自动驾驶汽车算法所需的数据。当前的技术标签不仅包括捕获的图像和视频帧中的对象,还包括视频序列中的场景和条件。
 
  此外,还标记了数据收集条件。这提供了一个条件矩阵,工程师可以使用这些条件矩阵来针对各种场景、天气条件和一天中的时间测试算法的性能。当性能不符合关键性能指标时,工程师会收集和处理更多数据以进行验证。
 
  数据处理后,AI 工程师使用标记的数据来训练感知算法和其他自动驾驶功能。这是一个迭代过程,工程师根据需要调整算法参数,然后重新训练算法,此时将下一组标记数据添加到训练集中。此过程一直持续到达到所需的模型性能和准确性为止。
 
  AI公司正在不断地改进和扩展这些开发工具的功能。
 
  NVIDIA 汽车副总裁丹尼·夏皮罗 (Danny Shapiro) 表示:“我们拥有的数据越多样化、越公正,构成深度神经网络等AI系统的算法就越强大、越安全。我们还定义了关键性能指标来衡量收集到的数据质量,并将合成数据添加到我们的训练数据集中。最终目标是不断添加训练数据,以构建一个包含位置、条件和场景的综合矩阵。”
 
  算法训练数据的不断丰富和细化对于保持自动驾驶技术发展和进步的势头至关重要。它还为更复杂的模拟奠定了基础,这是自动驾驶汽车设计创新的主要推动者之一。
 
  夏皮罗说:“在开发过程中,必须在各种驾驶条件下对自动驾驶技术进行一次又一次的评估,以确保这些车辆比人类驾驶的车辆安全得多。模拟在虚拟世界中运行试驾场景,向驾驶堆栈提供渲染的传感器数据并执行驾驶命令。重新模拟将之前记录的传感器数据回放到驾驶堆栈。人工智能模型最终根据大量且不断增长的测试数据集进行验证。”
 
  ▍将自动驾驶汽车模拟提升到一个新的水平
 
  迄今为止,从感官和操作来源提取的算法训练数据仅用于自动驾驶汽车开发人员。仅仅提供无人驾驶汽车运行时遇到的所有变量是不够的。
 
  问题在于,目前的自动驾驶测试车队不可能遇到训练自动驾驶汽车安全应对现实世界所需的所有罕见和危险的场景和条件。
 
  例如,一个穿着深色衣服的小孩晚上在街上跑出来不是一种可以反复测试的常见场景,但却是自动驾驶汽车必须能够安全、正确地做出反应的场景。当前的实体车辆测试无法在足够大的范围内进行验证。它受限于车队规模和测试区域的地理位置。
 
  然而,随着AI和计算技术的不断发展,现在可以在部署前通过安全测试和验证自动驾驶设计和技术来填补空白。
 
  夏皮罗说:“NVIDIA DRIVE Sim等高保真、时间准确的模拟平台提供了一个物理上准确的驾驶环境数字双胞胎,以支持大规模开发和验证自动驾驶汽车,而不会让其他人在路上受到伤害。与现实世界的试驾相比,这可以提高效率、成本效益,最重要的是安全性。”
 
  使用每个域的专用模型模拟驾驶环境、交通和车辆行为的能力使自动驾驶汽车测试能够在没有脚本的情况下进行。汽车设计师可以使用仿真来测试边缘情况并挖掘车辆在现实世界中可能遇到的未知变量。
 
  一旦发现,这些模拟场景可以用于迭代测试自动驾驶汽车,在部署前改进汽车的硬件和软件。有了这种水平的模拟,自动驾驶汽车制造商可以加快开发,减少宝贵的时间和成本。
 
  然而,先进的技术带来了一系列全新的挑战。通过模拟重建真实世界的驾驶场景和生成真实的数据可能耗时且劳动密集,需要熟练的工程师。即便如此,这也可能很困难。
 
  ▍综合真实场景
 
  为了进一步推进自动驾驶,开发人员已经开始使用两种基于AI的技术,通过生成逼真的合成训练数据和重建真实世界的驾驶场景来增强模拟。
 
  这些技术中的第一种被称为虚拟重建。此方法将真实世界场景复制为完全合成的3D场景。这些数据可以帮助训练算法并增强自动驾驶汽车模拟能力。
 
  开发人员首先将有问题的道路网络的数字双胞胎转换为可驾驶的模拟环境,然后工程师使用该环境来重现事件,例如在施工区导航。如果出现任何缺口,开发人员将基于人工智能的交通模型应用于被跟踪对象,以预测其将如何反应并填补其轨迹中的缺口。
 
  虚拟重建帮助开发人员找到具有潜在挑战性的情况来训练和验证自动驾驶系统,使用高保真度、传感器生成的数据来增强AI行为模型,工程师可以使用这些模型来创建新的场景。来自场景的数据也可以训练行为模型。
 
  第二种方法称为神经重建,使用人工智能将录制的视频数据转化为模拟。该过程从记录的驾驶数据开始。AI从这种材料中识别并提取关键的动态元素,并将其加载到高保真度模拟中,工程师可以根据需要进行更改。这种方法允许闭环测试,并在自动驾驶软件和它所处的世界之间进行充分地交互。
 
  ▍深入了解AI
 
  AI 不仅重新定义了自动驾驶汽车的设计方式,而且在无人驾驶汽车控制和安全等领域发挥着关键作用。
 
  CerebrumX首席技术官Sarika Gupta表示:“AI和机器学习使车辆控制系统能够评估风险并做出预防事故的决策。配备AI技术的车辆可以分析来自摄像头、激光雷达和雷达等各种传感器的数据,并识别道路上的潜在危险。然后,AI算法可以做出避免这些危险的决定,例如减速或变道。这项技术有可能大大减少事故数量。”
 
  虽然风险评估具有巨大潜力,但该技术也是自动驾驶最大的漏洞之一。
 
  Nauto的Alpert说:“即使是当今最先进的系统也无法在发生危险情况时提供足够的警告,因此它们需要人工持续监控情况,并准备好立即接管。”。
 
  开发人员希望,随着AI增强仿真的成熟并提供更高的准确性和可见性,控制算法可以提供更安全、更可靠的决策和控制。
 
  ▍自动驾驶汽车找到自己的声音了吗?
 
  自然语言处理的进步正在进入下一代汽车。这些系统通常可以处理复杂的查询,并允许驾驶员或乘客自然地与车内系统进行通信。
 
  但AI技术与车内语音应用的匹配并不是一成不变的。如今,自动驾驶开发者必须决定哪种风格的AI语音最适合无人驾驶汽车。
 
  一种选择是对话式AI。在当今的数字助理中可以找到这种技术的好例子。这是一项更成熟的技术,因此,它已经开始开拓自己的利基市场。
 
  Sama产品高级副总裁Duncan Curtis表示:“从技术准备的角度来看,亚马逊的Alexa、苹果的Siri和谷歌的Assistant等车载语音辅助技术已经部署在全球许多车辆上。这些系统是为车内体验精心设计的。”
 
  
 
  图 2:配备AI风险评估系统的自动驾驶汽车可以分析来自车载和基础设施传感器的数据,并识别道路上的潜在危险。图片由 Sama 提供。
 
  另一种选择,生成式 AI,如ChatGPT,仍处于早期阶段。
 
  这种风格的AI专注于开发无监督和半监督算法,它能够从现有数据中产生新的内容,如文本、音频、视频、图像和代码。
 
  Alpert说:“生成式AI有潜力实现一系列新的应用。这包括显著改进车内语音助理的功能。例如,可以使用语音识别让导航应用程序找到最近的咖啡店。一个基于生成型AI和大型语言模型的更高级助手将能够回答更复杂、更个性化的问题,比如‘给我找一个洗手间干净、汽油便宜且绕行时间不会超过 5 分钟的加油站。’这样的助手将更善于理解驾驶员的意图,并提供更丰富的反应。”
 
  然而,这些问题继续影响生成式AI的可靠性,这些缺陷阻碍了其应用的推广。
 
  Curtis说:“至于ChatGPT和其他生成式AI系统,现阶段还没有大规模部署。我们仍处于了解如何以安全的方式在车辆内启用ChatGPT等功能的早期阶段。例如,让它访问音乐功能很容易,但核心的车辆驾驶和安全功能还有很长的路要走。”
 
  最近推出的第三个选项称为SoundHound Chat AI for Automotive,它将生成式AI功能与对话式AI的语音助手相结合,提供了一种车载语音助手。该平台承诺让司机及其乘客能够访问大量信息域(图3)。
 
  AI技术开发人员认为,他们的系统可以响应用户的复合查询,例如“摇下窗户,关掉空调”,以及从多个领域获取知识的复杂查询,如“打开空调,然后导航到最近的沙龙,在那里我可以修指甲,而且营业时间超过下午 6 点。”
 
  
 
  图 3:对话式AI可以让自动驾驶汽车和乘客实时访问多域信息,并提供支持语音的车内控制。图片由 SoundHound 提供。
 
  SoundHound汽车业务发展总监Matt Anderson表示:“通过超越命令和控制技术,并预测驾驶员的需求,先进的语音人工智能使汽车制造商能够摆脱循序渐进的语音菜单,提供对话式、方便快捷的语音体验。在简化车辆“用户体验”的整体设计的同时,现代AI驱动的语音技术还减少了硬按钮和软按钮的数量,提高了系统的整体安全性,同时为制造商腾出了宝贵的空间。”
 
  考虑到可用选项和功能组合,自动驾驶开发人员在确定标准 AI 方法之前需要一段时间是一个不错的选择。