董遠,1970年生,男,北京郵電大學,教授,博士生導師,擁有國內、國際被授權專利12項,發表學術文章近百篇。同時被法國電信集團授予法國電信外聘學術專家-“FranceTelecom-OrangeExpert”,參與指導法國電信在多媒體內容數據挖掘方面的學術研究。專業方向 :
音頻、圖像、視頻搜尋
1.教育經歷
1999年,獲得上海交通大學,通信與信息系統,博士學位。
1996年,西安電子科技大學,碩士
1990年,西安電子科技大學,本科
2.工作經歷
2004年-2014年法國電信北京研究中心多媒體搜尋實驗室主任法國電信集團外聘學術專家“FranceTelecom-Orangeexpert”
2001年-2003年研究員/博士後(PostdoctoralResearchStaff),英國劍橋大學工程系,語音視覺機器人組(HTKSpeechResearchGroup[4])。歐盟項目CORETEX項目主要研發負責人,此項由歐洲四所大學承接,目的目的是提高語音識別的核心技術。
1999年-2001年研究員,諾基亞研究中心,語音與聽覺實驗室,研究員
諾基亞手機中文話音撥號語音識別系統,主要研發人。
諾基亞手機東方語種話音撥號語音識別系統,主要研發人。
3.研究的項目與研究興趣
目前的研究興趣:
基於深度學習的人臉檢測、人臉特徵點定位與人臉識別,基於深度學習的圖像物體與場景識別
基於深度學習的視頻內容分析,色情視頻檢測、暴力視頻檢測等
曾經的研究興趣:語音識別、說話人識別、語音識別與語音合成、中文分詞與詞性標註等
4.研究課題
國際合作項目視頻搜尋中的大數據挖掘
教育部科學技術研究項目>重點項目“面向網路安全的生物特徵模板保護”
國家自然科學基金項目>重大研究計畫培育項目,“視頻選擇性注意機理與語義特徵提取”
自然科學基金面上項目,“具有信息隱藏功能的腦電信號生物識別新方法”
“十二五”國家高技術研究發展計畫(863計畫)信息技術領域主題項目,No.2012AA012505
教育部留學回國人員科研基金項目,“基於電話系統的非特定文本說話人識別系統的研究”
5.部分發表文章
[1]YuanDong,ChongHuang,WeiLiu,RankCNN:Whenlearningtorankencountersthepseudopreferencefeedback,ComputerStandards&Interfaces,Volume36,Issue3,March2014,Pages554–562
[2]YuanDong,GangQin,GuoruiXiao,Advancednewsvideoparsingviavisualcharacteristicsofanchorpersonscenes,Telecommunicationsystems,Springer-Verlag,July2013,Volume54,Issue3(2013),Page247-263
[3]YuanDong,ShanGao,KunTao,Performanceevaluationofearlyandlatefusionmethodsforgenericsemanticsindexing,PatternAnalysisandApplications,Springer-Verlag,Feb2014,Volume17,Page37-50
[4]Dong,Yuan;Lian,Shiguo,Automaticandfasttemporalsegmentationforpersonalizednewsconsuming,INFORMATIONSYSTEMSFRONTIERS,Springer-Verlag,July2012,Volume14,Issue3,pp517-526
[5]DongYuan,ZhangJiwei,ZhaoNan,ChangXiaofu,LiuWei,VideoConceptDetectionBasedonMultipleFeaturesandClassifiersFusion,ChinaCommunications2012,Vol.9Issue(8):105-121
[6]XianyuZhao,YuanDong,VariationalBayesianJointFactorAnalysisModelsforSpeakerVerification,IEEETRANSACTIONSONAUDIO,SPEECHANDLANGUAGEPROCESSING,Page1032–1042,VOL.20,No.3,March2012,
[7]Dongyuan,ZhangJiwei,XiaofuChang,JianZhao,AUTOMATICSPORTSVIDEOGENRECATEGORIZATIONFORBROADCASTVIDEOS,http://vcip2012.org/,VisualCommunicationsandImageProcessing(VCIP),page1-5,2012IEEE,27-30Nov,2012,SanDiego,USA
[8]YuanDong,KunTao,XiaofuChang,ShanGao,JiweiZhang,HongliangBai,WeiLiu,FengZhao,PengLi,ChengbinZen,TheFranceTelecomOrangeLabs(Beijing)VideoSemanticIndexingSystems–TRECVID2011NotebookPaper,http://www-nlpir.nist.gov/projects/tvpubs/tv11.papers/ftrdbj.pdf
[9]YuanDong,XianyuZhao,ZhongxuanLiu,ChengyuDong,JiqingLiu,LiangLu,ZheWei,GuoruiXiao,ShiguoLian,RonggangWang,KunTao,TheFranceTelecomOrangeLabs(Beijing)VideoHigh-levelFeatureExtractionSystems–TrecVid2009NotebookPaper,http://www-nlpir.nist.gov/projects/tvpubs/tv9.papers/ftrdbj.pdf
[10]董遠,周濤,董乘宇,王海拉,ATwo-stageProsodicStructureGenerationStrategyforMandarinText-to-speechSystems,ACTAAUTOMATICASINACA,2010Vol.36:1569-1574,
[11]DONGYuan,LULiang,ZHAOXianyu,ZHAOJian,"StudiesonModelDistanceNormalizationApproachinText-IndependentSpeakerVerification",ACTAAUTOMATICASINACA,May2009,Vol.35,No.5,page556-560
6.部分授權專利
[1]董遠;高珊;黃珺,場地運動精彩鏡頭集錦自動生成方法,專利號:200910089357.0
[2]董遠,黃煜斌,基於主場景鏡頭關鍵幀的體育視頻分類方法,專利號:200910089358.5
[3]董遠;周濤,基於韻律短語的韻律結構生成方法,專利號:200910091510.3,
[4]董遠;周濤,四層結構的中文文本正則化體系及實現,專利號:200910089359.X