课程 ID: 16436
描述:
案例背景:
在很多机器学习场景中,面临着实时特征计算的需求(如风控、实时推荐等)。为了保证实时计算的低延迟、高吞吐,工程化团队需要针对线上性能需求对特征计算做针对性优化。但是,在机器学习离线开发阶段,数据科学家往往会习惯使用 Python 等数据处理友好的工具进行特征脚本开发。因此,在将特征脚本从离线脚本,迁移优化到可上线系统的过程中,存在着计算逻辑需要进行线上线下一致性校验的问题。在实践中,线上线下一致性校验往往会耗费大量的人力,造成 AI 工程化落地的高成本。
解决思路:
在此次分享中,我们将介绍开源的线上线下一致的生产级特征平台 – OpenMLDB。使用 OpenMLDB 统一的基于 SQL 的线上线下开发接口,以及线上线下分别优化的执行引擎,可以保证线上线下一致性,同时可满足在线业务的高性能的需求。基于 OpenMLDB 的特征平台方案,不仅满足了业务的需求,而且大大降低了企业人工智能落地的成本。
成果:
OpenMLDB 目前已经在上百个企业级人工智能场景中得到落地。性能方面线上实时 SQL 引擎基于完全自研的高性能时序数据库,对于实时特征计算可以达到毫秒级别的延迟,性能远超出流行商业内存数据库