这项苹果自动驾驶技术可以制造更好的汽车和AR

导读 苹果公司关于自动驾驶汽车如何更好、更经济地识别行人和其他潜在危险的研究已经在网上发现,让人们对库比蒂诺公司的秘密项目有了新的了解。

苹果公司关于自动驾驶汽车如何更好、更经济地识别行人和其他潜在危险的研究已经在网上发现,让人们对库比蒂诺公司的秘密项目有了新的了解。长期以来,一直有传言称该公司正在研究自动驾驶技术,最近的看法是它希望开发的不是苹果品牌的汽车,而是可以授权给汽车制造商的软件。

然而,虽然苹果高管对无人驾驶汽车的复杂性发表了一般性评论,但关于该公司希望在该领域做些什么的细节却鲜为人知。然而,苹果研究人员提交的关于 3D 对象检测的新论文在某种程度上揭开了帷幕。

根据他们的 LinkedIn 个人资料,Yin Zhou 和 Oncel Tuzel 是 Apple 的 AI 研究人员。他们于 11 月 17 日向学术网站arXiv提交了一篇题为“VoxelNet: End-to-End Learning for Point Cloud Based 3D Object Detection”的论文。它描述了一种方法,通过该方法,从激光雷达创建的 3D 点云中识别对象的挑战扫描仪可以变得更高效。

激光雷达——或光探测和测距——传感器在自动驾驶汽车上很常见。他们使用快速旋转的激光阵列,将光线从汽车周围的目标反射回来。通过测量反射光,他们可以建立所谓的点云,显示 3D 空间中存在的内容。

扫描仪本身在历史上非常昂贵,尽管制造商近年来的努力帮助降低了这些成本,更不用说从旧的无人驾驶原型机上笨重的桶状突出物来缩小硬件本身。即便如此,点云本身还不足以让车辆导航世界。由此,软件需要弄清楚每个点簇代表什么,是另一辆车、行人、骑自行车者还是其他东西,以及是否存在可能的风险。

系统 Zhou 和 Tuzel 的轮廓被称为 VoxelNet,这是一个 3D 检测网络,将特征提取和边界框预测结合在一起,并将其组合成“单阶段、端到端可训练的深度网络”。实际上,它将点云拆分为 3D 体素块,然后将该块内的一组点转换为体素特征编码 (VFE) 层提供的“统一特征表示”。

这将移交给区域提议网络或 RPN,该网络使用可以在每个块内识别的模式进行编码。传统上,自动驾驶汽车将使用基于图像或视频的 RPN,结合激光雷达,需要更多的传感器。然而,这种新的 VoxelNet 方法允许 RPN 单独直接应用于 LIDAR 点云。

研究人员写道,结果是他们的系统可以“大幅”超越其他当前的 LIDAR 3D 检测方法,尤其是具有“非常令人鼓舞”的发现骑自行车者和行人的能力。这可能意味着车辆配备的传感器更少,这将降低复杂性和成本。

尽管自动驾驶汽车是 VoxelNet 技术采用的一种可能途径,但它并不是唯一的途径。Zhou 和 Tuzel 建议,它可以同样适用于机器人和增强现实或虚拟现实,所有这些都需要一种快速有效的方法来实时识别物体。

苹果公司的研究方法通常是一种秘密方法。该公司传统上不愿意讨论其内部工作,直到有产品使用该技术来展示它。然而,尽管保留了发射惊喜,但该策略在获得新人才方面可以说是适得其反,因为科学家和工程师通常希望宣传或至少公开讨论他们的工作。

因此,Apple 推出了Apple Machine Learning Journal,实际上是其团队精选研究的博客。最近,它描述了计算机视觉机器学习团队通过神经网络进行人脸检测的努力,但完全依赖于设备上的处理,而不是像其他系统那样将数据上传到云端。之前的研究文章涵盖了手写识别、Siri 如何检测“嘿 Siri”提示,以及如何更有效地训练神经网络本身。

最新文章