自动驾驶是一种使用盘算机手艺和传感器等装备使汽车或其他交通工具能够在没有人类司机干预的qing况下自主驾驶的手艺。基本原理是通过传感器(如激光雷达、摄像头、雷达等)实时感知识别车辆及周边情形(蹊径、交通标志、障碍物和其他交通加入者)等qing况,再通过智能系统举行妄想决议,最后通过控制系统执行驾驶操作。
自动驾驶实现的历程,简朴的来说是从感知、决议到执行,整个历程的实现对于人工智能(AI)/机械学习(ML)有着很深的应用和依赖。因此,自动驾驶生长的瓶颈主要在于这些AI算法模子上的突破。为了找到最佳的AI算法模子,算法工程师需要一直地调整超参数,对天天的路测数据举行处置赏罚,重复训练优化自动驾驶模子,并举行大量验证测试事情,以迭代出更准确的算法,这些事情的背后需要大量算力资源(GPU资源)。
自动驾驶训练带来的挑战
训练一个自动驾驶方案依赖大量的真实数据,数据收罗车配备多个传感器举行数据收罗,并将收罗到的数据传输到深度学习GPU集群用于训练、学习以构建更智能的驾驶决议算法。数据收罗车通常使用6-10个摄像头、4-6个雷达和2-4个激光雷达,它们都有差异的分辨率和距离规模,守旧估算,一辆测试车天天发生的数据量可达 10 TB。
更大规模的数据集与更短的训练时间的诉求, 仅依赖单张 GPU、甚至单台 GPU 服务器已经无法知足自动驾驶 AI 训练的要求,多机多卡 GPU 盘算集群成为一定选择。
另外,AI模子越重大,模子参数越多,训练历程中的通讯消耗也越大。一些大型 AI 模子的训练历程中,通讯时间消耗占比已经凌驾 50%。在优化端到端的性能时,尊龙凯时既需要思量服务器内部的通讯,也需要优化服务器外部的通讯。