这几天,自动驾驶领域最火的话题莫过于特斯拉的“全自动驾驶计算机”。
北京时间4月23日凌晨,在加州帕洛阿尔托举行的特斯拉自主投资者日(Autonomy Investor Day)上,马斯克终于亮出了自家的自动驾驶“核武器”——特斯拉“全自动驾驶计算机”(full self-driving computer,以下称 FSD 计算机),即之前所说的 Autopilot 硬件 3.0。
在这之前,马斯克多次在公共场合为自家的全自动驾驶造势,大肆卖力宣传特斯拉即将实现全自动驾驶。为了吸引公众的注意,还在Twitter上提前预告全自动驾驶将大幅涨价,吊足了吃瓜群众的胃口。
FSD 计算机于周一亮相后确实引发了不小的轰动,不仅因为它的表现令人惊艳,还因为马斯克全力开怼几乎整个自动驾驶行业都在使用的激光雷达。
马斯克在自动投资日上毫不留情面的叫板制造或使用激光雷达的各大企业:傻瓜才用雷达。用现在的网络流行语来说就是:在自动驾驶汽车上使用激光雷达的各位都是垃圾。
马斯克之所以敢这么说想必是对自家的自动驾驶系统信心满满。那么FSD 计算机究竟有多厉害,我们一起来扒一扒。
特斯拉FSD 计算机甩英伟达自动驾驶芯片好几条街?
FSD 计算机的投入使用意味着特斯拉首度使用了自研自动驾驶 AI 芯片,目前这款芯片正安装进特斯拉生产线上的每一台电动车中。根据特斯拉官网信息,“完全自动驾驶能力”选装价格为 46300 元,但如果在交付后安装,价格则会上涨到 6.5 万元。
每台FSD计算机都包含许多组件:8 个视觉摄像头,12 个超声波传感器,雷达,以及这款定制设计的全自动驾驶双冗余 FSD 计算机,其中最重要的是特斯拉定制的芯片。每个FSD包含两个芯片,每个芯片都有两个专门设计用来运行神经网络的加速器。神经网络是特斯拉汽车用来读取道路信息的人工智能组件。
开发这款芯片的负责人正是特斯拉从苹果挖来的芯片设计师Pete Bannon,他曾参与 iPhone 5 A5 芯片以及多款 iPhone 芯片开发。不难看出,在这次设计中,这位曾经与 Jim Keller 搭档领导苹果芯片研发部门的顶尖芯片架构师,也将苹果软硬深度结合的风格带到了特斯拉,可以说非常 Apple 了。
从公布的一系列的参数来看,这款车载芯片无疑是相当强大的一款硬件:
特斯拉新芯片上的神经网络加速器可以处理来自汽车 8 个不断运行的摄像头的每秒 2100 帧的输入图像。这相当于每秒 25 亿像素。这款马斯克口中「世界上最好的芯片」尺寸为 260 平方毫米,拥有 60 亿晶体管,具有双核神经网络阵列,每秒可运行 36 万亿次操作,采用 14 纳米工艺制造。与上一代 Autopilot 硬件(由英伟达硬件驱动)相比,特斯拉声称每秒帧数处理能力提高了 21 倍。
与特斯拉目前的硬件相比,它的性能显著提升,最多可以每秒进行超过144万亿次运算(特斯拉说是英伟达 Drive Xavier 理论性能值每秒21万亿次运算的 7 倍)。该芯片的设计还减少了能耗,它的功耗为72瓦,其中15瓦为特斯拉的神经网络供电。
业内人士都知道,要让自动驾驶汽车成为现实,需要巨大的处理能力。就从处理能力来看,FSD计算机的性能非常令人惊艳,拥有巨大的领先优势。
但马斯克称特斯拉自动驾驶芯片最牛,甩了英伟达好几条街,这点英伟达并不服。
英伟达第一个跳出来反对:特斯拉在比较上耍了花招,具有欺骗性
英伟达汽车高级总监 Danny Shapiro在接受外媒的采访时表示:特斯拉将自己的芯片与特斯拉的芯片进行比较“并不准确”。
首先特斯拉将其两种芯片的处理能力与英伟达生产的一种芯片进行了比较。此外,只有一个Xavier处理器的系统是为辅助驾驶的自动驾驶仪而设计的,而不是完全自动驾驶。
即便如此,特斯拉还是低估了英伟达芯片的处理能力。被特斯拉拿来比较的英伟达芯片不是每秒21万亿次运算,而是每秒30万亿次运算。
最后,与特斯拉新芯片作比较的是英伟达于2016年推出的Xavier计算机,是较老的硬件。更公平的做法应该是与英伟达最新的自动驾驶Pegasus计算机进行比较,这款计算机的处理速度为每秒320 万亿次运算,运算速度是特斯拉新的FSD计算机的两倍多,不过它的耗电量也相应增加。
因此,特斯拉将其自动驾驶计算机FSD描述为“比英伟达更强大”是错误的,具有欺骗性。
特斯拉嫌弃激光雷达,坚定地选择计算机视觉
在讲述自动驾驶软件时,特斯拉人工智能高级主管 Andrej Karpathy 强调特物理数据无法代替,对于依赖虚拟仿真自动驾驶,特斯拉更相信现实物理数据。说人话就是,看图比雷达更真实。
然后他就开始怼激光雷达方案,人类开车完全是视觉驱动,激光雷达是一种捷径。它回避了自动驾驶最重要的视觉识别最基本的问题。给人一种进步的错觉,没有解决到本质问题。
特斯拉的车载芯片能够处理来自视觉传感器收集到的车道线、交通、行人等信息,将这些信号与已知的物体进行匹配再最终作出决策。
在发布会后环节中,马斯克再次重申自己的态度,我们不用激光雷达,这就是态度,并发出豪言:「任何使用激光雷达的自动驾驶公司注定失败」。马斯克全力开怼激光雷达成为了本次发布会亮点之一。
什么是激光雷达?激光雷达的工作原理上和一般的超声波雷达一样,激光利用遇到障碍物后折返时间计算相对距离。激光光束可以准确测量视场中物体轮廓边沿与设备间的相对距离,这些轮廓信息组成所谓的点云并绘制出 3D 环境地图,精度可达到厘米级别,从而提高测量精度。
实质上,无论是使用激光雷达还是计算机视觉,目的都是为了让自动驾驶汽车“看清”周围的环境。但目前参与自动驾驶技术的企业基本都是采用激光雷达方案,如Google Waymo、百度、UBER、Cruise 等。
因此,马斯克的这番言论随即遭到了业内人士的集体讨伐。
驭势科技创始人兼CEO吴甘沙:如果他要表达的是主要靠激光雷达没前途,我是认同的,毕竟摄像头视觉能够有更丰富的维度去理解这个世界;如果他的意思是完全不用激光雷达,那一定是有问题的,在相当长的一段时间内纯视觉方案的鲁棒性一定是不如视觉加激光融合方案的。两三年以后,激光雷达的成本对于robotaxi不会是问题。
甚至还有大咖调侃:我也可以说,任何“不”使用激光雷达(主动式传感器,其他如毫米波雷达)的自动驾驶公司注定失败。
总的来说,特斯拉认为,摄像头+数据+神经网络,足以挑战激光雷达。如此认定计算机视觉嫌弃激光雷达,这种选择现阶段这在业内也非常罕见,绝大多数业者还是采用激光雷达的方案或者激光雷达+计算机视觉。
目前最佳的无人驾驶的方案没有定论,在某些特定场景下只用摄像头也是可以实现的。但首先,自动驾驶的主流传感器应该在各种条件下,保证感知的稳定和准确。这点激光雷达相较摄像头有很大的优势。所以未来较长一段时间,完全排斥激光雷达是不现实的,还是以多种复合技术提高安全性为佳。
转载请注明出处。