百度|百度“飞桨”是怎么成为世界第三的?( 二 )


所谓深度学习框架 , 其实就是首先提供一个深度学习的内部系统 , 可以符合多种行业的应用能通过各种不同的接口调取这种学习能力 , 从而让新开发的项目迅速通过数据的积累训练系统 , 学会如何人工思考和应对 。 这样的好处就是整个项目不用再对深度学习进行算法和布局 , 更不用从理论基础去做相应的研发 , 可以大大降低人工智能项目研发的难度 。
其次 , 这些深度学习框架还提供了调取相应深度学习结果和培训系统能力的程序语言 , 并封装了很多常用的模块 , 后续开发者只需调用这些模块就可以实现一些系统常用的功能 , 比如说对于图片和音频的识别等 。
此外 , 这些深度学习框架还提供额外的扩展与延伸 , 可以跟其他的一些系统相衔接 , 把人工智能的相应能力接触到更大的系统中去 。
从2017年之后 , 国内大大小小的人工智能应用 , 绝大多数都是基于这两个框架平台所提供的各种服务和封装模块进行 , 虽然大大降低了开发人员的难度 , 但很大程度上也将技术核心的支持能力拱手相让 。
正是看到这一点 , 2016年百度提出来中国人自己的深度学习框架PaddlePaddle 。 但说实话彼时百度的这一框架并没有显露出太多技术优势 , 在国内被使用的频次也不算太高 。
即便如此 , 对于百度一把手李彦宏而言 , AI是百度未来发展的突破口 , 所以深度学习框架这块也必须得到百度整个技术部门的大力扶持 。
2018 年 7 月 , 李彦宏在百度 AI 开发者大会上喊出了要让“Everyone Can AI”的口号 , 其实这句口号后面还要加上一个限定——“通过百度的 AI 平台” 。 PaddlePaddle 就是这一口号付诸实践的突破点之一 。
2019 年 4 月 , 时任百度高级副总裁(现百度 CTO)王海峰在 Wave Summit 深度学习开发者峰会上 , 为深度学习框架 PaddlePaddle 在百度内部的战略地位进行了定调 。 PaddlePaddle 发布中文名“飞桨” , 开始强调自己更懂中国开发者 , 以及更加专注于深度学习模型的工业生产和部署 。
【百度|百度“飞桨”是怎么成为世界第三的?】02丨飞桨的特色
实际上 , 飞桨以百度多年的深度学习技术研究和业务应用为基础 , 集深度学习核心训练和推理框架、基础模型库、端到端开发套件、丰富的工具组件于一体 , 是中国首个自主研发、功能完备、开源开放的产业级深度学习平台 。
关键从2015年之后 , 百度将自己业务突破的能力定立到了人工智能上 , 而几乎百度现在所有的人工智能项目全都是基于飞桨的整个体系研发 , 并最终投入使用和做后期维护的 。
某种意义上正是基于百度本身体量的大范围应用 , 才迅速缩短了飞桨的成熟时间 。

作为我国首个开源开放、功能完备的产业级深度学习平台 , 飞桨想要保持自己的地位 , 也必须要有自己独特的优势 。
第一 , 便捷的开发框架 。 飞桨同时支持动态图和静态图的编程 , 能够兼顾易用性和效率 。 在整个开发过程当中 , 算法工程师既需要方便的接口 , 同时也需要高效的底层平台的支持 。 飞桨平台结合了动态图的易用性和静态图的高性能 , 使开发者可以兼顾两者的优势 。 对开发者来说 , 这是大大降低了写程序的成本和复杂度 。
第二 , 超大规模深度学习模型训练技术 。 针对大规模的工业化场景 , 飞桨提供大规模分布式训练能力 , 在真正的工业场景应对自如 。 飞桨平台推出了支持万亿规模参数模型的实时更新能力和训练能力 。 面对大型分类任务时可以进行模型并行训练 , 在训练层面也可以支持数据并行训练 。

相关经验推荐