专题出品人: 靳江明

图森未来 高性能计算研发总监

专题:AI(下午场)

以专注技术为行动准则,紧密锁定人工智能领域海内外行业前沿进展,本专场选取具代表性的AI行业落地实践进行系统的讲述。结合实践案例解读,系统分析AI落地案例成功的要点,为大家讲解人工智能技术创新与行业应用。

本专题下的议题

自动驾驶关键技术探索 - 来自系统和性能方面的思考
靳江明 图森未来 高性能计算研发总监
所属专题:AI(下午场)

课程概要

案例背景介绍:
基于计算机视觉以及多传感器融合的无人驾驶技术已成为人工智能的一个重要领域。随着深度学习的大规模部署、视觉算法准确度的大幅提高、以及算力的大幅提升,无人驾驶相关技术得到了迅速的发展。如何在有限的车载计算资源中完成复杂的CPU/GPU计算流,并保证过程中的高效的通信成为自动驾驶系统建设的关键技术。另外,如果在线下提供高可用的深度学习训练和数据处理平台也成为保障自动驾驶车队规模部署的关键技术之一。我将接合以上挑战来阐述来自图森的探索、实践、和思考。

解决思路/成功要点:
网络模型压缩和编译优化、资源调度优化,以及积极探索的系统和平台建设。

成果:
自动驾驶系统和平台建设和不断优化,一直支撑着图森持续增长的车队和数据规模,在系统吞吐量和效率上一直保持领先的优势,并且有着很高的可用性和稳定性。

听众收益

1. 了解自动驾驶系统的技术难点和性能优化经验 2. 了解网络压缩加速和编译优化方面的积极探索 3. 了解深度学习平台建设的实践

大规模分布式深度神经网络训练系统中的通信优化
孙鹏 商汤科技 高级研究员
所属专题:AI(下午场)

课程概要

案例背景介绍:
大规模深度神经网络的训练过程中通信开销将会严重降低集群训练的整体性能。在百卡规模训练场景下,GPU集群的计算资源整体利用率甚至达不到50%。因此需要优化分布式训练系统的通信组件,降低网络开销,提升大规模训练系统的性能。

解决思路/成功要点:
通过延迟通信和粗粒度稀疏通信技术,提高分布式训练系统的带宽利用率和降低网络流量,从而降低训练过程中的通信开销。

成果:
集群训练系统扩展到512卡规模,在ImageNet/AlexNet训练场景下达到1s/epoch的性能。

听众收益

1)深度神经网络训练过程中的通信过程;2)现阶段深度神经网络训练系统的通信组件的实现;3)深度神经网络训练系统的通信优化技巧。

基于人工智能算法的计算系统及架构优化
喻之斌 中国科学院深圳先进技术研究院 数字所 研究员/副所长
所属专题:AI(下午场)

课程概要

案例背景介绍:
大数据系统如Spark有多大40多个性能攸关的配置参数。手工配置这些参数不仅费时费力,且难以达到优化效果。

解决思路/成功要点:
我们提出了利用人工智能算法来优化大数据系统配置参数的思路。

成果:
利用人工智能算法优化大数据系统的配置,性能提高超出了我们的预期。利用人工智能算法来优化大数据系统的性能是可行的。

听众收益

1. 了解到大数据系统的配置对性能至关重要。2. 大数据系统的配置参数多,难以优化。3.基于人工智能算法的大数据配置优化方法是可行的。

靳江明,于2013年毕业于新加坡南洋理工大学计算机工程学院并行与分布式计算中心,获博士学位。2013年-2016年分别在摩根大通新加坡和北京办公室担任HPC和Quantitative Risk Calculation系统分析师和研发经理。靳江明于2017年加入图森未来,担任高性能计算研发总监,负责图森无人车系统的性能调优以及图森深度学习系统的搭建和优化工作。

专题:AI(下午场)

以专注技术为行动准则,紧密锁定人工智能领域海内外行业前沿进展,本专场选取具代表性的AI行业落地实践进行系统的讲述。结合实践案例解读,系统分析AI落地案例成功的要点,为大家讲解人工智能技术创新与行业应用。

其他相关专题

CopyRight © 2008-2019 Msup & 高可用架构