讲师
掌门集团
音视频技术研发总监,资深研究员
博士,研究方向数字信号处理、全景音频重现理论(VR音频)。目前任掌门集团(WIFI万能钥匙)音视频技术研发总监,资源研究员。 曾就职于行者悟空声学技术有限公司首席技术官(联合创始人),阿里巴巴前高级技术专家(P8), 阿里音乐音视频部门总监、Visualon音频部门经理、盛大创新院研究员、Freescale 上海研发中心多媒体部门。 早期Google Android SDK多媒体架构的贡献者,开源AMR_WB 编码器工程开发者;5项技术发明专利、二十余篇专业论文和多项软件著作权,参与过浙江省杭州重大专项项目,浙江省金华科委项目,上海市科委项目(球谐域全景音频关键技术研究)。 早期专业Blog: http://www.cnblogs.com/huaping-audio/
演讲:语音编解码技术演进和应用选型
时间
2017-10-21 17:00 - 17:45
地点
鸿运厅2
主要内容
以时间为主线,讲述语音编解码技术的演进路线,同时从语音编解码特性,来指导实际应用中编解码器的选择。
所属专题
编解码实践应用
编解码始终是核心技术,也是难点,如何做到带宽成本、清晰度、流畅度之间的平衡,伴随着FFmpeg和H.265的普及,各家在实践应用中各显神通。
同专题的演讲
赵军
随着视频图像数据的爆发式增长,对视频图像处理的性能要求越来越高,在大部分的的平台上,有专门的硬件用于执行Video相关的任务,这些硬件被用于解码,编码,转码,图像后处理,视频分析等任务,这些方案与纯粹的CPU方案相比较,在功耗和性能方面有很大优势;但也同我们所知道的大部分的事情一样,利弊共存;即使如此,在一些实时场景以及对Video性能有很高要求的情况下(如高密度的视频转码),FFmpeg的硬件加速方案依然凸显出了非常高价值,在Intel平台上,我们使用Intel的GPU,提供了一套基于VAAPI/Media SDK的硬件加速方案,本报告将介绍Intel平台下的FFmpeg的GPU加速的当前状态以及一些技术细节,同时给出进一步的开发计划,并综述了FFmpeg在其他平台上的硬件加速方案。
鲍金龙
a) 如何去除左右图像之间的空间冗余;相比左右排列,编码效率提高30%以上; b) 在不明显降低质量的前提下大幅提高压缩效率。主要思想是对图像进行分层处理,不同层的图像使用不同的编码质量; c) 在可接受的延时下大幅提高X265编码器在超过16核心时候的并行效率; d) 大幅提高X265编码器在4k图像上的编码速度。
李大龙

2017年初腾讯视频启动提升全网清晰度攻坚战,这对自身已有海量用户基数的业务而言,面临巨大的成本增加。在利用技术创新“保本”增效的探索道路上,我们一方面将智能学习技术引入到编码场景划分、ROI码率增强、图像质量评测等辅助编码环节,向率失真极限再次发起冲击;另一方面从客户端方案入手,重构了统一播放框架、用极致可靠的前端实现推进HEVC的大规模成熟应用。

此次分享覆盖腾讯视频近期在编解码两端的技术探索和实践经验:从HEVC编码算法框架谈起,如何在计算效率与压缩效率之间取得平衡;而后结合近年来智能学习技术的发展,重点介绍腾讯视频在编码各环节的辅助增强思路及实施方案;最后全面归纳移动端播放框架的形成与演进,梳理HEVC划时代跃进背景下对我们的挑战以及应对之道。

李成亚
近两年,视频在互联网社交领域爆发式增长,极大的提高了内容的丰富程度和用户体验;但是,相较于文字/图片内容,视频要复杂的多,它会消耗几乎所有的硬件资源(CPU/GPU、内存、磁盘、带宽);本此分享结合新浪微博视频相关业务的发展历程,对视频转码服务的架构变迁做了一个深入的剖析;也会结合每个阶段我们碰到的一些业务、技术上的问题,分享一些具体的实践方案。
朱政
KSC265在各个阶段的研发思路以及重点投入的方向;KSC265如何一步步实现复杂度与X264的对标,并保持H.265应有的压缩性能;KSC265的研发规划。
Zoe Liu
Google started the WebM Project in 2010 to develop open source, royalty-­free video codecs designed specifically for media on the Web. The second generation codec released by the WebM project, VP9, ­is currently served by YouTube, and enjoys billions of views per day. Realizing the need for even greater compression efficiency to cope with the growing demand for video on the web, the WebM team embarked on an ambitious project to develop a next edition codec AV1, in a consortium of major tech companies called the Alliance for Open Media (AOM), that achieves at least a generational improvement in coding efficiency over VP9. In this talk, we focus primarily on the new tools developed by AV1, including the tools and coding modes for the prediction of pixel blocks that improve intra, inter and combined inter-intra prediction, as well as new paradigms for transform, interpolation filtering, coefficient entropy-coding, super-resolution, and restoration filtering.