讲师
驭势科技
人工智能组组长
本硕博毕业于清华大学,研究方向是机器学习和相关的计算机视觉应用。2014年毕业后加入格灵深瞳,从事深度学习和计算机视觉方向研究,为格灵深瞳的行为分析仪、人眼相机、视频结构化、视觉定位等多个项目、产品研发核心算法和模型。2017年加入驭势科技,负责基于视觉的自动驾驶解决方案的研发。
演讲:隐藏在摄像头里的AI
时间
2017-10-20 14:00 - 14:45
地点
鸿运厅2
主要内容

1. 摄像头里的数据宝藏

2. 计算机视觉的神奇方法——深度学习

3. 在安防中的使用

4. 在自动驾驶中的使用

所属专题
AI+多媒体应用
从图像与文字识别、视频内容分析、压缩算法、美颜、语音识别,AI让诸多领域取得突破性进步,通过赋予多媒体应用智能能力,让音视频技术应用有了更大的想象空间。
同专题的演讲
赵丽丽
从产品化角度介绍深度学习在短视频视觉内容分析中的核心应用方向,从研发层面讲解前沿深度学习算法在产品化应用于短视频分析时的技术难点和解决方案。
梁健
你是否希望能够给你的视频库的内容增加自动的描述?是否想过自动总结视频里关键话题?通过人脸来搜索视频内容?自动生成多种视频字幕?随着人工智能技术快速发展,媒体服务迎来了新的机遇。利用智能云平台,在媒体服务中,我们可以增加更多智能体验,获取和识别更多的信息和洞察力(insight)。让我们一起看看利用微软的Azure Media Service (媒体服务),Video Indexer 和媒体分析技术实现智能化的场景,比如Speech-to-Text, Face Recognition, OCR, Object Tagging, 视频总结等。
刘彬

视频作为一个重要的媒介,承载了图像、语音、文本等多个维度的信息,如何通过人工智能技术对海量的视频进行数据结构化,进而挖掘视频中的商业价值是我们急需解决的问题。

主要技术呈现:

1. image level analysis

2. sequence level analysis

3. multi-modality fusion