置身事内:腾讯的造芯之路( 四 )


方向没有问题,技术和工艺也没问题,腾讯高级执行副总裁、TEG(技术工程事业部)总裁卢山给予了全面支持 , 并通过总办争取到了更多的headcount和资金 。
有了公司战略的支持 , 团队志气满满奔赴更大的战场 。蓬莱实验室副总监Austin决定兵分两路,在AI推理和视频编解码上并行推进 。
AI小分队继续做蓬莱的2.0版“紫霄” 。这是《封神演义》里鸿钧老祖所居宫殿的名字 。在稳固的仙山上牢筑“紫霄”,代表了新的野心:
这次,他们将目标直接定为业界第一 。

置身事内:腾讯的造芯之路

文章插图


紫霄所有的架构都围绕着有效算力去做 。团队优化片上缓存设计,并摒弃竞品常用的GDDR6内存,采用先进的2.5D封装技术,把HBM2e内存与AI芯片合封在一起,从而把内存带宽提升了近40% 。
技术迭代一日千里 。紫霄立项后,业内最高性能表现又被竞品刷新 。虽然紫霄的设计性能相比这个最高表现还足够“安全”,但团队还打算继续加码 。
经过研究,他们在芯片内部增加了计算机视觉CV加速器以及视频编解码加速器,可创新性地大幅减小AI芯片和x86 CPU之间的交互和等待 。
即便因此而增加了两个复杂的自研模块,团队仍然在计划的6个月时间里完成了从架构确定到验证以及流片的全部流程 。
2021年9月10日,紫霄顺利点亮 。
置身事内:腾讯的造芯之路

文章插图


在图片和视频处理、自然语言处理、搜索推荐等应用场景下,这款芯片打破了制约算力发挥的瓶颈点,最终在实际业务场景性能表现达到了业界标品的2倍 。
04
独立自研,“沧海”一笑
AI小分队给自己芯片取名“紫霄”,而视频编解码则取名“沧海”,颇有海天相接之意 。
不同于蓬莱和紫霄主打AI,沧海是一款视频转码芯片 。如果说当年QQ相册图片的转码问题是蓬莱团队做硬件的最早契机 , 那视频编解码小分队在这个方向上的继续探索,正是完成了一次对初心的呼应 。
不同的是,“沧海”的应用场景已经远超当年的范畴 。
当多媒体业务从图片时代进化到音视频直播时代,天量的4K/8K超高清的数字内容如潮水一般持续冲击着云计算基础设施 。每增加一个比特的数据,都会带来相应的转码算力和CDN带宽成本 。
这是一道直观而严峻的数学题,而沧海小分队的解题目标也非常清晰,那就是要做一款业界最强的视频转码芯片,把压缩率发挥到极致 。
好在,腾讯丰富的多媒体应用场景,以及腾讯云覆盖的众多直播互动头部客户,为沧海的研发提供了得天独厚的分析和验证条件 。
置身事内:腾讯的造芯之路

文章插图


团队先是推出了沧海的核心自研模块——硬件视频编码器“瑶池”,并决定在沧海完成研发之前给瑶池一次大考 。
这个大考就是2020年的MSU世界编解码大赛,该大赛由莫斯科国立大学(MSU)主办,十多年来一直是全球视频压缩领域最具影响力的顶级赛事,吸引了包括英特尔、英伟达、谷歌、华为、阿里和腾讯在内的国内外知名科技企业参与 。
结果是,瑶池实现1080P@60Hz的视频实时编码,力压群雄获得了SSIM (结构相似性)、PSNR(峰值信噪比)和VMAF(视频多方法评估融合)等各项客观指标评测第一名,以及人眼主观评价第一的好成绩,相比第二名领先了一个身位 。
经此硬仗,沧海在技术上得到了充分检阅 。
2022年3月5日,Derick和他带领的视频编解码小分队收到流片回来的芯片“沧海”,又正逢深圳因疫情而全面远程办公 。

相关经验推荐