讲师
Google
软件工程师
谷歌(Google)软件工程师,主要致力于视频编码与视频通信的算法设计与实现。曾在美国贝尔实验室(Bell Labs), 诺基亚研究中心(Nokia Research Center), 以及惠普实验室(HP Labs)等处从事理论算法研究,后转入工业届,尤其参与了如下视频通话产品的设计与推出:苹果(Apple)的FaceTime,谈客 (TangoMe)Video Calls,以及 谷歌眼镜(Google Glass)专属Hangouts Video Calls。目前在谷歌从事AV1视频编码的标准制作与产品优化,以及图像、视频相关领域新技术的探索。
演讲:Emerging AV1 Video Codec - Novel Inter and Intra Prediction Tools Under Consideration
时间
2017-10-21 10:00 - 10:45
地点
鸿运厅2
主要内容
Google started the WebM Project in 2010 to develop open source, royalty-­free video codecs designed specifically for media on the Web. The second generation codec released by the WebM project, VP9, ­is currently served by YouTube, and enjoys billions of views per day. Realizing the need for even greater compression efficiency to cope with the growing demand for video on the web, the WebM team embarked on an ambitious project to develop a next edition codec AV1, in a consortium of major tech companies called the Alliance for Open Media (AOM), that achieves at least a generational improvement in coding efficiency over VP9. In this talk, we focus primarily on the new tools developed by AV1, including the tools and coding modes for the prediction of pixel blocks that improve intra, inter and combined inter-intra prediction, as well as new paradigms for transform, interpolation filtering, coefficient entropy-coding, super-resolution, and restoration filtering.
所属专题
编解码实践应用
编解码始终是核心技术,也是难点,如何做到带宽成本、清晰度、流畅度之间的平衡,伴随着FFmpeg和H.265的普及,各家在实践应用中各显神通。
同专题的演讲
赵军
随着视频图像数据的爆发式增长,对视频图像处理的性能要求越来越高,在大部分的的平台上,有专门的硬件用于执行Video相关的任务,这些硬件被用于解码,编码,转码,图像后处理,视频分析等任务,这些方案与纯粹的CPU方案相比较,在功耗和性能方面有很大优势;但也同我们所知道的大部分的事情一样,利弊共存;即使如此,在一些实时场景以及对Video性能有很高要求的情况下(如高密度的视频转码),FFmpeg的硬件加速方案依然凸显出了非常高价值,在Intel平台上,我们使用Intel的GPU,提供了一套基于VAAPI/Media SDK的硬件加速方案,本报告将介绍Intel平台下的FFmpeg的GPU加速的当前状态以及一些技术细节,同时给出进一步的开发计划,并综述了FFmpeg在其他平台上的硬件加速方案。
鲍金龙
a) 如何去除左右图像之间的空间冗余;相比左右排列,编码效率提高30%以上; b) 在不明显降低质量的前提下大幅提高压缩效率。主要思想是对图像进行分层处理,不同层的图像使用不同的编码质量; c) 在可接受的延时下大幅提高X265编码器在超过16核心时候的并行效率; d) 大幅提高X265编码器在4k图像上的编码速度。
李大龙

2017年初腾讯视频启动提升全网清晰度攻坚战,这对自身已有海量用户基数的业务而言,面临巨大的成本增加。在利用技术创新“保本”增效的探索道路上,我们一方面将智能学习技术引入到编码场景划分、ROI码率增强、图像质量评测等辅助编码环节,向率失真极限再次发起冲击;另一方面从客户端方案入手,重构了统一播放框架、用极致可靠的前端实现推进HEVC的大规模成熟应用。

此次分享覆盖腾讯视频近期在编解码两端的技术探索和实践经验:从HEVC编码算法框架谈起,如何在计算效率与压缩效率之间取得平衡;而后结合近年来智能学习技术的发展,重点介绍腾讯视频在编码各环节的辅助增强思路及实施方案;最后全面归纳移动端播放框架的形成与演进,梳理HEVC划时代跃进背景下对我们的挑战以及应对之道。

李成亚
近两年,视频在互联网社交领域爆发式增长,极大的提高了内容的丰富程度和用户体验;但是,相较于文字/图片内容,视频要复杂的多,它会消耗几乎所有的硬件资源(CPU/GPU、内存、磁盘、带宽);本此分享结合新浪微博视频相关业务的发展历程,对视频转码服务的架构变迁做了一个深入的剖析;也会结合每个阶段我们碰到的一些业务、技术上的问题,分享一些具体的实践方案。
刘华平
以时间为主线,讲述语音编解码技术的演进路线,同时从语音编解码特性,来指导实际应用中编解码器的选择。
朱政
KSC265在各个阶段的研发思路以及重点投入的方向;KSC265如何一步步实现复杂度与X264的对标,并保持H.265应有的压缩性能;KSC265的研发规划。