专题出品人
三好网
联合创始人及CTO
卫向军,现任三好网联合创始人及CTO,负责中小学在线直播互动系统和O2O教学服务平台,曾在微软、金山、新浪微博从事技术研发管理工作,在大规模系统架构设计、直播系统、分布式存储系统和通讯系统上有丰富的经验。
专题:AI+多媒体应用
时间
2017/10/20 14:00 - 18:00
地点
鸿运厅2
主要内容
从图像与文字识别、视频内容分析、压缩算法、美颜、语音识别,AI让诸多领域取得突破性进步,通过赋予多媒体应用智能能力,让音视频技术应用有了更大的想象空间。
该专题的演讲
赵丽丽
从产品化角度介绍深度学习在短视频视觉内容分析中的核心应用方向,从研发层面讲解前沿深度学习算法在产品化应用于短视频分析时的技术难点和解决方案。
梁健
你是否希望能够给你的视频库的内容增加自动的描述?是否想过自动总结视频里关键话题?通过人脸来搜索视频内容?自动生成多种视频字幕?随着人工智能技术快速发展,媒体服务迎来了新的机遇。利用智能云平台,在媒体服务中,我们可以增加更多智能体验,获取和识别更多的信息和洞察力(insight)。让我们一起看看利用微软的Azure Media Service (媒体服务),Video Indexer 和媒体分析技术实现智能化的场景,比如Speech-to-Text, Face Recognition, OCR, Object Tagging, 视频总结等。
潘争

1. 摄像头里的数据宝藏

2. 计算机视觉的神奇方法——深度学习

3. 在安防中的使用

4. 在自动驾驶中的使用

刘彬

视频作为一个重要的媒介,承载了图像、语音、文本等多个维度的信息,如何通过人工智能技术对海量的视频进行数据结构化,进而挖掘视频中的商业价值是我们急需解决的问题。

主要技术呈现:

1. image level analysis

2. sequence level analysis

3. multi-modality fusion