实时深度学习训练PAI-ODL

刘童璇

中文演讲 2022-07-30 14:00 GMT+8  #ai

DeepRec(PAI-TF)是阿里巴巴集团统一的大规模稀疏模型训练/预测引擎,广泛应用于淘宝、天猫、阿里妈妈、高德、淘特、AliExpress、Lazada等,支持了淘宝搜索、推荐、广告等核心业务,支撑着千亿特征、万亿样本的超大规模稀疏训练。

基于DeepRec、Flink、Kafka、Flink-AIFlow打造的Online Deep Learning,将在线学习与离线训练相结合,打造一体化的在线离线学习框架,基于云原生架构,提供给用户从离线到在线的一套完整解决方案。本次演讲将会介绍ODL场景下的一系列的关键技术,包括:超大稀疏模型训练/预测、秒级的模型热更新、实时训练模型校正、模型回退及样本回放、样本修复、实时训练弹性资源调度等等。

Speakers:


刘童璇: 阿里云智能计算平台事业部PAI, 高级技术专家, 长期从事机器学习平台/深度学习引擎的研发,负责大规模稀疏模型的训练和预测优化,长期支持阿里搜索、推荐、广告等核心业务,负责阿里大规模稀疏模型训练框架DeepRec、ODL。