百度 PLATO 是一种大规模机器学习算法,由百度开发的一款开源多模型学习框架,是百度旗下最大规模的深度学习框架。它集成了计算图、分布式深度学习模型和算法,为不同的深度学习应用提供跨模型、跨算法的服务。其功能可以用诸如情感分析、自然语言理解、图像识别等等应用来说明。
PLATO主要提供了三大功能:模型部署、培训、优化。模型部署用于将训练的模型发布到产生环境中,并以HTTP或Websocket的方式提供服务。培训模块包括可视化编辑器、模型构建器、分布式训练模式选择器、参数配置器等,提供了一套易用的模型培训流程。优化模块支持模型在多个训练平台的优化训练及调优,为用户提供多层优化工具,以改进模型性能。
PLATO对深度学习模型的支持是通过开源跨语言框架,如TensorFlow、PyTorch、Caffe2等,通过多模型支持的方式来进行实现。为此,PLATO在发布之初就支持了多种主流深度学习框架,包括TensorFlow、Keras、Caffe2、PyTorch、MXNet、PaddlePaddle等深度学习平台。
此外,也支持Xgboost,LightGBM,Catboost,RandomForest等传统机器学习模型,用户可以混合不同的模型方法以使用更加高效的优化算法。比如,在混合特征生成的应用中,可以混合深度学习和传统机器学习,构建一个高效可信的大规模模型算法。
为了方便实用,PLATO引入了自研发的Alice工作流管理系统,支持可视化操作与流程定义,可以快捷地设置模型的训练、验证、测试、部署等功能,可以更好地满足用户的需求。
百度PLATO大模型算法使深度学习模型及机器学习算法更容易使用,也提供单一的服务器端环境,在部署和管理上更具有可操作性,提高了开发者的效率和工作效率,为开发者提供了更多的资源,为业内带来了很多便利,也推动了数据分析技术的普及与发展。