母院背景

母院背景

中心介紹

Introduction

中國科學院深圳先進技術研究院多媒體集成技術研究中心成立于2009年,主要致力于計算機視覺、圖像處理、模式識別、語音處理、機器學習等領域的研究和開發。中心由計算機視覺領域世界知名專家湯曉鷗教授擔任主任,團隊成員包括深圳市鵬城學者長期特聘教授、深圳市杰青等成員構成,核心成員均有海外知名高校和研究機構留學經歷。中心成員先后主持國家自然科學基金十項,承擔省市級各類科研項目四十余項。2011年,湯曉鷗教授為帶頭人的廣東省引進創新團隊成功獲批,中心還牽頭組建了深圳市機器視覺與模式識別重點實驗室。

喬宇-集成所副所長,多媒體集成技術研究中心 執行主任

簡介:
喬宇:研究員,主要研究興趣包括計算機視覺、圖像處理、語音處理和模式識別等?,F任深圳先進技術研究院集成技術研究所副所長,深圳市“機器視覺與模式識別”重點實驗室副主任。2011年獲得中國科學院“百人計劃”擇優支持,入選深圳市“孔雀計劃”首批海外高層次人才,是廣東省引進創新科研團隊核心成員。

研究方向:
計算機視覺、圖像處理、語音處理和模式識別等

職務:

集成所副所長、多媒體集成技術研究中心執行主任

獲獎及榮譽:

受聘為深圳市鵬城學者長期特聘教授

獲中國科學院盧嘉錫青年人才獎

 

【項目簡介】
快速圖像去霧
提出基于插值引導濾波的快速圖像和視頻去霧,速度提升10倍以上,利用單核CPU實現對1024×768以內的視頻的實時去霧處理。

跨年齡跨模態人像識別

跨年齡人像識別算法在MORPH Album 2(國際上最大的跨年齡階段人臉數據集)上達到93.5%(第一識別率),在國際最大的素描-照片數據庫上和光學紅外數據庫上均達到世界領先的識別率(前者大于97%;后者大于85%)。研制的初步模型已經在廣州市公安局組織的廣州地鐵動態測試(真實場景下的視頻監控的人臉測試)中取得令人滿意的結果。

跨年齡階段人像識別 跨模態人像識別(左素描-照片;右光學紅外)

 

人臉年齡與屬性估計

研究團隊開發了基于二值化編碼與維度選擇的快速人臉屬性識別。同時開發正交高斯回歸的人臉年齡估計算法,在MORPH數據庫誤差<4.2歲,在FGNET數據庫上誤差< 4.8歲,均位居國際前列。

基于二值化編碼與維度選擇的快速人臉屬性識別

 

三維物體重建與檢索

研究復雜線畫圖的拆分重構方法,提出基于貝葉斯學習的圖元匹配方法、人造平面物體對稱性檢測算法等,大大提高了對于復雜線畫圖重構的穩定性和準確性。 并開發了基于學習語義屬性的三維物體檢索方法。
 

 

場景快速分類

提出區域共生特征用于場景和紋理分類,在多個大規模數據Labelme, UIUC-sports, Scenes-15,MIT-indoor,SUN上取得世界領先的識別率,且其速度快,可以用30ms處理256x256的圖像。

 

場景文本檢測

提出基于卷積神經網絡場景文本檢測方法,在ICDAR05 和ICDAR11數據庫上取得世界領先的結果 。

 

復雜場景下行人檢測

引入深度學習方法,復雜場景下行人檢測精度達世界領先水平,在Caltech, ETH等數據集上較當前最好方法相對錯誤率降低5%以上。

較其它新發表方法誤差率降低百分比

 

多視角超向量

提出融合多種局部特征的新型圖像和視頻表方法,利用混合概率CCA模型分解不同類型特征的共享和獨立部分,成果論文被CVPR 2014錄用為Oral,錄用率5.75%.

 

視頻中人的姿態檢測

提出Dynamic poselet模型用于視頻中人的姿態檢測,在MSR-II和JHMDB上取得遠超傳統方法的結果。

 

智能編輯技術

a)物體切割

在圖像切割中我們采用一個簡單的交互式算法來實現對物體的切割。擴展到視頻切割中,我們采用object propagation model(OPM)將關鍵幀中物體的切割結果擴展到其它幀上。

交互式圖像切割



視頻切割

 

 

b)多媒體場景合成

本項目目標是精確的將圖像或視頻中的物體精確摳出并計算透明度,從而實現背景替換等特效。

 

c)物體抹去

我們采用運動估計的方法,建立起幀間對應點的聯系,并通過加速使計算時間大為縮短。

 

d)內容重構

圖像內容重構是指對圖像中內容進行或者場景進行重排、內容復制或者給予內容的不失真圖像尺度變換。采用圖像塊貼補方式,并使用多層置信傳播算法進行優化。

多媒體集成技術研究中心

中心聯系方式

CONTACT

聯系人:曹曉燕

地址:天津市西青區海泰發展六道興企一號園區

電話:022-60965987

郵箱:caoxiaoyan@tiat.ac.cn

Powered by CmsEasy