专题出品人: 靳江明

图森未来 高性能计算研发总监

专题:AI(下午场)

以专注技术为行动准则,紧密锁定人工智能领域海内外行业前沿进展,本专场选取具代表性的AI行业落地实践进行系统的讲述。结合实践案例解读,系统分析AI落地案例成功的要点,为大家讲解人工智能技术创新与行业应用。

本专题下的议题

自动驾驶关键技术探索 - 来自系统和性能方面的思考
靳江明 图森未来 高性能计算研发总监
所属专题:AI(下午场)

课程概要

案例背景介绍:
基于计算机视觉以及多传感器融合的无人驾驶技术已成为人工智能的一个重要领域。随着深度学习的大规模部署、视觉算法准确度的大幅提高、以及算力的大幅提升,无人驾驶相关技术得到了迅速的发展。如何在有限的车载计算资源中完成复杂的CPU/GPU计算流,并保证过程中的高效的通信成为自动驾驶系统建设的关键技术。另外,如果在线下提供高可用的深度学习训练和数据处理平台也成为保障自动驾驶车队规模部署的关键技术之一。我将接合以上挑战来阐述来自图森的探索、实践、和思考。

解决思路/成功要点:
网络模型压缩和编译优化、资源调度优化,以及积极探索的系统和平台建设。

成果:
自动驾驶系统和平台建设和不断优化,一直支撑着图森持续增长的车队和数据规模,在系统吞吐量和效率上一直保持领先的优势,并且有着很高的可用性和稳定性。

听众收益

1. 了解自动驾驶系统的技术难点和性能优化经验 2. 了解网络压缩加速和编译优化方面的积极探索 3. 了解深度学习平台建设的实践

大规模分布式深度神经网络训练系统中的通信优化
孙鹏 商汤科技 高级研究员
所属专题:AI(下午场)

课程概要

案例背景介绍:
大规模深度神经网络的训练过程中通信开销将会严重降低集群训练的整体性能。在百卡规模训练场景下,GPU集群的计算资源整体利用率甚至达不到50%。因此需要优化分布式训练系统的通信组件,降低网络开销,提升大规模训练系统的性能。

解决思路/成功要点:
通过延迟通信和粗粒度稀疏通信技术,提高分布式训练系统的带宽利用率和降低网络流量,从而降低训练过程中的通信开销。

成果:
集群训练系统扩展到512卡规模,在ImageNet/AlexNet训练场景下达到1s/epoch的性能。

听众收益

1)深度神经网络训练过程中的通信过程;2)现阶段深度神经网络训练系统的通信组件的实现;3)深度神经网络训练系统的通信优化技巧。

趣头条新闻推荐大规模机器学习落地实践
汤浪 上海基分文化传播有限公司 推荐算法工程负责人
所属专题:AI(下午场)

课程概要

案例背景介绍:
常规的机器学习平台,在落地使用容易遇到几大问题:1)数据大模型训练时间长,更新不及时,2)特征更新慢,特征工程工作量大,训练时有特征穿越问题,3)尝试新模型时,准备工作长,上手难等问题

解决思路/成功要点:
1、引入特征服务,统一管理特征数据;2、自研参数服务器,解决大规模数据训练问题;3、使用k8s构建机器学习平台,可方便的创建不同模型训练任务

成果:
平台上线之初,模型效果显著,对推荐文章的点击率有10%以上提升;后续为各类模型迭代优化提供了极大便利,半年时间内,平台上有多个改进模型有明显效果,累加对pv和时长有5%以上提升;目前平台支持着大量的模型实验,正在运行的模型大概20左右

听众收益

1、了解常见的机器学习方法如何落地使用、工程化; 2、了解当一些开源方案无法支持大数据、高并发场景下的优化方案 3、流式训练模型,实时计算场景的落地方案

基于计算机视觉技术和统计学习的内容推荐系统质量测试体系
唐洪敏 淘宝 高级测试开发专家
所属专题:AI(下午场)

课程概要

背景介绍:
本次分享将结合淘宝导购推荐系统的测试场景,介绍海量的feeds流内容,碎片化机型环境、个性化推荐分发,庞大用户群体的业务挑战下,如何通过ai技术进行问题发现,体验度量,丰富和提效测试手段。

解决思路/成功要点:
将模板匹配,相似检测,异常识别,ocr,机器学习等cv技术,算法能力与真机测试结合,进行无线适配,异常,性能,容灾等自动化检测,使得测试手段更加高效和仿真。以用户视角,通过cv技术、统计学习,数据挖掘和建模分析等手段,多维度评测和度量个性化推荐系统用户体验。

成果:
实现内容导购,活动会场在无线自动化、适配、页面异常检测等方面测试工作自动化、常态化,提前高效发现问题。千人千面导购推荐系统用户体验可被整体度量评估,导购图像素材质量评估和审核效率提升。

听众收益

1. 了解AI技术在无线测试领域的实践方案。
2. 了解个性化推荐系统评测标准和方法流程。
3. 了解图像素材质量评估手段。

靳江明,于2013年毕业于新加坡南洋理工大学计算机工程学院并行与分布式计算中心,获博士学位。2013年-2016年分别在摩根大通新加坡和北京办公室担任HPC和Quantitative Risk Calculation系统分析师和研发经理。靳江明于2017年加入图森未来,担任高性能计算研发总监,负责图森无人车系统的性能调优以及图森深度学习系统的搭建和优化工作。

专题:AI(下午场)

以专注技术为行动准则,紧密锁定人工智能领域海内外行业前沿进展,本专场选取具代表性的AI行业落地实践进行系统的讲述。结合实践案例解读,系统分析AI落地案例成功的要点,为大家讲解人工智能技术创新与行业应用。

其他相关专题

CopyRight © 2008-2019 Msup & 高可用架构