唐勝[中科院計算所副研究員]

唐勝[中科院計算所副研究員]
更多義項 ▼ 收起列表 ▲

唐勝,男,2006年3月博士畢業於中國科學院計算技術研究所(簡稱計算所)後留所工作,2008年3月起先後任副研究員、碩士生導師和博士生導師,中國計算機學會高級會員。在國家973、863、國家自然科學基金和242重點項目的支持下,帶領團隊長期從事多媒體內容分析與檢索、計算機視覺與模式識別研究,相關論文發表於多媒體、計算機視覺和人工智慧的國際頂級會議ICCV、AAAI、IJCAI、MICCAI、ACM Multimedia和頂級期刊TPAMI、TIP等。研發的多項圖像視頻分析、檢索與識別系統已經在國家重要部門獲得大規模套用,部署在全國多地,套用效果顯著。主持2014年全國首屆特定音視頻檢索識別挑戰賽視頻評測;帶領團隊在美國NIST舉辦的視頻檢索國際評測TRECVID 2008和國際著名的ImageNet大規模視覺識別挑戰賽(ILSVRC 2015、2016)中取得優異成績。2007年獲計算所首批“百星計畫”資助,2008年和2014年計算所優秀科研人員;榮獲2006年度和2014年度北京市科學技術獎一等獎、2012年中國計算機學會科學技術獎、2017年中國電子學會科學技術獎(技術發明類)一等獎、2018年中國電子學會科學技術獎(自然科學類)一等獎。

研究方向

多媒體內容分析與檢索、計算機視覺與深度學習、模式識別與人工智慧

教育經歷

2001/9 - 2006/3,中國科學院計算技術研究所,計算機套用技術,工學博士

1998/9 - 2001/7,湘潭大學,計算機套用技術,工學碩士

1989/10 - 1993/6,湘潭大學,機械工程系化工機械專業,工學學士

工作經歷

2008/3 - 至今,中國科學院計算技術研究所,前瞻研究實驗室,副研究員,碩士生導師,博士生導師

2009/2 - 2010/2,National University of Singapore, School of Computing, Visiting Research Fellow, Supervisor: Prof.Chua Tat-Seng

2006/7 - 2006/8,National University of Singapore, School of Computing, Visiting Scientist, Supervisor: Prof.Chua Tat-Seng

2006/3 - 2008/3,中國科學院計算技術研究所,前瞻研究實驗室,助理研究員

1993/6 - 1998/9,湘潭大學,工程師,高級程式設計師

獲獎及榮譽

1、2015年,作為計算所MCG-ICT-CAS參賽團隊負責人,帶領團隊參加國際著名的ImageNet大規模視覺識別挑戰賽(ImageNet Large Scale Visual Recognition Challenge,ILSVRC,計算機視覺領域公認的最權威國際評測) ,在包括微軟、高通等70家參賽隊伍的激烈競爭中,我們在競爭激烈的目標分類定位和目標檢測任務(僅使用比賽指定的數據集)中取得優異成績:目標分類定位(CLS-LOC)精度達到85.31%(即錯誤率14.69%),在23支全球參賽隊伍中排第四名;在目標檢測(DET)任務中,目標檢測精度達到45.36%,在20支全球參賽隊伍中排第五名,詳見 ;並應邀於2016年1月在視覺與學習青年學者研討會(Vision And Learning SEminar, 簡稱VALSE) 上做 ImageNet競賽專題報告。

2、2016年,帶領計算所MCG-ICT-CAS參賽團隊第二次參加了國際著名的ImageNet大規模視覺識別挑戰賽(ILSVRC 2016)三個任務,在85家參賽隊伍的激烈競爭中,取得優異成績:傳統圖像目標檢測任務(Object Detection Task, DET)獲第四名,視頻目標檢測(Object Detection from Video, VID)的檢測和跟蹤兩個子任務均獲第三名,新增的語義分割即場景分析(Scene Parsing)任務獲第三名,並被組委會邀請在2016年歐洲計算機視覺會議(ECCV2016)的ImageNet和CCO視覺識別挑戰賽聯合工作組會議(ImageNet and COCO Visual Recognition Challenges Joint Workshop)上做大會報告,詳見ILSVRC 2016主頁 ,以及相應的ECCV 2016 Workshop 和我們的大會報告PPT 。

3、主持2014年全國首屆特定音視頻檢索識別挑戰賽視頻評測,深受清華大學、北京大學、復旦大學、中國科學院深圳先進技術研究院等28家參賽團隊好評。

4、2006年至2008年,作為計算所MCG-ICT-CAS參賽團隊負責人,帶領團隊參加國際視頻檢索權威評測TRECVID並取得優異成績(2007年取得搜尋任務第2名,2008年取得搜尋任務第1名、拷貝檢測任務第2名),應邀參加了國際視頻檢索評測會議TRECVID 2008並做大會報告,受邀在TRECVID 2008評測大會上做大會報告,詳見TRECVID 2008 ,以及我們的大會報告 。

5、2007年聯合新加坡國立大學研發的互動式視頻檢索系統VisionGo,在國際圖像視頻檢索會議CIVR2007中獲視頻檢索現場評測最佳系統獎。

6、2014年北京市科學技術獎一等獎,獲獎項目為“大規模網路視頻處理與內容分析關鍵技術及套用”。

7、2006年北京市科學技術獎一等獎,獲獎項目為“面向體育訓練的三維人體運動模擬與視頻分析系統”。

8、2012年首屆中國計算機學會科學技術獎,獲獎項目為“大規模網路視頻內容分析關鍵技術及套用”。

9、2017年中國電子學會科學技術獎(技術發明類)一等獎,獲獎項目為“視覺大數據檢索與智慧型分析關鍵技術及套用”。

10、2018年中國電子學會科學技術獎(自然科學類)一等獎,獲獎項目為“網際網路視頻的高效流式計算理論與方法” 。

科研項目

1、國家重點研發計畫項目(2017YFC0820605),354萬,2018/02-2021/12,課題負責人

2、國家重點研發計畫項目,融合多通道語境信息的類人智慧型感知機制與方法(2017YFB1002202,543萬),中科院計算所子課題負責人(85萬),2017/10-2021/09

3、國家863計畫項目,異構媒體數據的關聯與挖掘研究(2014AA015202),333萬,2014/01-2016/12,課題執行負責人。

4、國家自然科學基金面上項目,基於稀疏表示和深度學習的大規模目標檢測(61572472),78.4萬,2016/01-2019/12,主持。

5、國家自然科學基金面上項目,基於跨域遷移學習的網路視頻檢索技術研究(61173054),57萬元,2012/01-2015/12,主持。

6、國家自然科學基金面上項目,融合顯式和隱含語義概念的視頻檢索技術研究(60873165),30萬,2009/01-2011/12,主持。

7、國家973計畫項目,圖像視頻分析與檢測技術(2007CB311105),450萬,2007/07- 2011/12,核心骨幹(排名第三)。

8、北京市自然科學基金面上項目,基於稀疏表示的大規模移動視覺搜尋技術研究(4152050),18萬,2015/01-2017/12,主持。

9、國家其他項目,大規模圖像檢索與識別系統(20157300),120.8萬,2016/01-2017/12,主持。

10、冰島Videntifier科技公司,圖像語義檢測國際合作(Y505161000),20萬,2014/08-2015/07,主持。

11、華為技術有限公司,圖像場景語義概念檢測研究(YB2013080040),60萬,2013/09 -2014/12,主持。

12、華為技術有限公司,媒體檢索和識別技術研究(YBCB2011049),55萬,2011/09-2012/08,項目執行負責人。

13、三星通信技術研究有限公司,自動內容識別技術研究(4920125200),60萬,2012/04-2013/03,主持。

14、三星通信技術研究有限公司,基於語義的圖像視頻檢索(4920115100),80萬,2011/09-2012/08,項目執行負責人。

主要論文

主要國際期刊論文(黑體的作者為本人,*表示本人為通訊作者) :

[1] Sheng Tang, Yan-Tao Zheng, Yu Wang, Tat-Seng Chua, “Sparse Ensemble Learning for Concept Detection”, IEEE Transactions on Multimedia, 14(1): 43-54, February 2012. (提出稀疏集成學習方法, CCFB類國際期刊)

[2] Rui Zhang, Sheng Tang*, Yongdong Zhang, Jintao Li, Shuicheng Yan, "Perspective-adaptive Convolutions for Scene Parsing", IEEE Transactions on Pattern Analysis and Machine Intelligence (T-PAMI), DOI: 10.1109/TPAMI.2018.2890637, Published online on January 1th, 2019. (CCF A類計算機視覺與人工智慧領域著名國際頂級期刊,通訊作者)

[3] Yu Li, Sheng Tang*, Min Lin, Yongdong Zhang, Jintao Li, Shuicheng Yan, "Implicit Negative Sub-categorization and Sink Diversion for Object Detection", IEEE Transactions on Image Processing, 27(4):1561-1574, April, 2018.(CCF A類國際頂級期刊,通訊作者)

[4] Linghui Li, Sheng Tang*, Lixi Deng, Yongdong Zhang and Qi Tian; “GLA: Global-local Attention for Image Description”, IEEE Transactions on Multimedia, IEEE Transactions on Multimedia, 20(3): 726-737, March, 2018. (CCFB類國際期刊,通訊作者)

[5] Sheng Tang, Yu Li, Lixi Deng, Yong-Dong Zhang; “Object Localization Based on Proposal Fusion”, IEEE Transactions on Multimedia, 19(9):2105-2116, September 2017.(CCFB類國際期刊)

[6] Sheng Tang, Yong-Dong Zhang, Zuo-Xin Xu, Haojie Li, Yan-Tao Zheng and Jin-Tao Li; “An Efficient Concept Detection System Via Sparse Ensemble Learning”, Neurocomputing, Volume 169, Pages 124-133, December 2015.(CCFC類國際期刊)

[7] YongDong Zhang, Yu Wang, Sheng Tang*, Steven C. H. Hoi, JinTao Li, “FSpH: Fitted spectral hashing for efficient similarity search”, Computer Vision and Image Understanding (CVIU), 124: 3-11, 2014.(CCFB類國際期刊,通訊作者)

[8] Wu Liu, Yongdong Zhang, Sheng Tang, Jinhui Tang, Richang Hong and Jintao Li, "Accurate Estimation of Human Body Orientation From RGB-D Sensors," IEEE Transactions on Cybernetics, vol.43, no.5, pp.1442-1452, Oct. 2013.(CCFB類國際期刊)

[9] Hongtao Xie, Ke Gao, Yongdong Zhang, Sheng Tang, Jintao Li, “Efficient Feature Detection and Effective Post-Verification for Large Scale Near-Duplicate Image Search”, IEEE Transactions on Multimedia, 13(6): 1319-1332, Dec. 2011.(CCFB類國際期刊)

[10] Yan Song, Yan-Tao Zheng, Sheng Tang, Xiangdong Zhou, Yongdong Zhang, Shouxun Lin, Tat-Seng Chua, “Localized Multiple Kernel Learning for Realistic Human Action Recognition in Videos”, IEEE Transactions on Circuits and Systems for Video Technology, 21(9): 1193-1202, September 2011.(CCFB類國際期刊)

主要國際會議論文 :

[11] Rui Zhang, Sheng Tang*, Yu Li, Junbo Guo, Yongdong Zhang, Jintao Li, Shuicheng Yan, “Style Separation and Synthesis via Generative Adversarial Networks”, ACM Multimedia 2018, Pages: 183-191, Oct.22-26, 2018, Seoul, Korea. (CCF A類多媒體國際頂級會議長文,通訊作者)

[12] Bin Wang, Guo-Jun Qi, Sheng Tang*, Liheng Zhang, Lixi Deng, Yongdong Zhang, “Automated Pulmonary Nodule Detection: High Sensitivity with Few Candidates”, International Conference on Medical Image Computing and Computer Assisted Intervention (MICCAI 2018), MICCAI 2018, LNCS 11071, Pages:759–767, September 16-20, 2018, Granada, Spain. (醫療影像處理國際頂級會議長文,通訊作者)

[13] Rui Zhang, Sheng Tang*, Luoqi Liu, Yongdong Zhang, Jintao Li, Shuicheng Yan,“High Resolution Feature Recovering for Accelerating Urban Scene Parsing”, The 27th International Joint Conference on Artificial Intelligence (IJCAI-2018), Pages: 1156-1162, Stockholm, Sweden, July 13-19, 2018(CCF A類人工智慧國際頂級會議長文,通訊作者)

[14] Yuchen Guo, Guiguang Ding, Jungong Han, Sheng Tang, “Zero-shot Learning with Attribute Selection”, The 32th AAAI Conference on Artificial Intelligence (AAAI-2018), February 2 - 7, 2018, New Orleans, USA. (CCF A類人工智慧國際頂級會議長文)

[15] Xiaohan Ding, Guiguang Ding, Jungong Han, Sheng Tang,“Auto-balanced Filter Pruning for Efficient Convolutional Neural Networks”, The 32th AAAI Conference on Artificial Intelligence (AAAI-2018), February 2 - 7, 2018, New Orleans, USA. (CCF A類人工智慧國際頂級會議長文)

[16] Rui Zhang, Sheng Tang*, YongDong Zhang, Jintao Li, Shuicheng Yan; “Scale-adaptive Convolutions for Scene Parsing”, The International Conference on Computer Vision (ICCV) 2017, Venice, Italy, October 22-29, 2017. ( CCF A類計算機視覺國際頂級會議長文 ,通訊作者)

[17] Rui Zhang, Sheng Tang*, Min Lin, Jintao Li, Shuicheng Yan,“Global-residual and Local-boundary Refinement Networks for Rectifying Scene Parsing Predictions”, The 26th International Joint Conference on Artificial Intelligence (IJCAI-2017),Pages:3427-3433,Melbourne, Australia, August 19-25, 2017(CCF A類人工智慧國際頂級會議長文, 通訊作者).

[18] Linghui Li, Sheng Tang*, Lixi Deng, Yongdong Zhang and Qi Tian,“Image Caption with Global-Local Attention”, The 31th AAAI Conference on Artificial Intelligence (AAAI-2017), Pages: 4133-4139, San Francisco, California USA, February 4–9, 2017(CCF A類人工智慧國際頂級會議長文, 通訊作者).

[19] Yu Wang, Sheng Tang, Yalin Zhang, Jintao Li, DanYi Chen, “Fitted spectral hashing”, ACM Multimedia 2013, Pages:645-648, October 21-25, Barcelona, Spain. (CCF A類多媒體國際頂級會議)

[20] Sheng Tang, Jin-Tao Li, Yong-Dong Zhang,etal; “PornProbe: an LDA-SVM based Pornography Detection System”; ACM Multimedia 2009, Beijing, China, Oct.19-24, 2009.

[21] Sheng Tang, Jin-Tao Li, Ming Li, Cheng Xie, Yi-Zhi Liu, Kun Tao, Shao-Xi Xu; “TRECVID 2008 High-Level Feature Extraction By MCG-ICT-CAS”; Proc. TRECVID 2008 Workshop, Gaithesburg, USA , Nov 2008.

[22] Sheng Tang, Jin-Tao Li, Yong-Dong Zhang, “SSF Fingerprint for Image Authentication: An Incidental Distortion Resistant Scheme”, ACM Multimedia 2005, Singapore, November 6-11, 2005.

主要專利

[1] 唐勝、伍天意、李錦濤,基於上下文信息指導的場景分割方法與系統,申請號:201811309249.5,申請日期:2018年11月5日

[2] 唐勝、伍天意、李錦濤,基於克羅內克卷積的場景分割方法與系統,申請號:201811309245.7,申請日期:2018年11月5日

[3] 唐勝、張蕊、李錦濤,基於特徵圖恢復的場景分割方法和系統,申請號:201810664250.3,申請日期:2018年6月25日

[4] 唐勝、李靈慧、張勇東、李錦濤,一種生成描述圖像內容的自然語言的方法與系統,發明專利,申請號:2017112652103,申請日期:2017年12月5日

[5] 唐勝、張蕊、李錦濤,融合局部信息的場景分割修正方法與系統,發明專利,申請號:201710650541.2,申請日期:2017年8月2日

[6] 唐勝、張蕊、李錦濤,融合全局信息的場景分割修正方法與系統,發明專利,申請號:201710650525.3,申請日期:2017年8月2日

[7] 唐勝、肖俊斌、李錦濤,一種基於目標檢測的大規模圖像檢索方法與系統,發明專利,申請號:201710574741.4,申請日期:2017年7月17日

[8] 唐勝、張勇東、 李錦濤、徐作新;字典學習、視覺詞袋特徵提取方法及檢索系統,發明專利,專利號:ZL 2014102876392,申請日期:2014年6月25日,(已授權)

[9] 唐勝、 張勇東、 李錦濤、徐作新;字典學習、視覺詞袋特徵提取方法及檢索系統,發明專利,申請號:201410287639.2,申請日期:2014年6月25日,(已授權)

[10] 唐勝、李錦濤、張勇東、謝 呈;一種數字圖像訓練和檢測方法;專利號:200910092710.0;申請日:2009.09.16(已授權)

[11] 謝呈;劉毅志; 唐勝;張勇東;李錦濤;色情檢測模型建立方法和色情檢測方法;專利號:201010143777.5;申請日:2010.04.12(已授權)

相關詞條

熱門詞條

聯絡我們