崔慧敏

崔慧敏 ,女,副研究員 。中國科學院計算技術研究所,計算機體系結構,博士。

基本信息

簡歷

受教育經歷

2006/09–2011/08,中國科學院計算技術研究所,計算機體系結構,博士
2001/09–2004/1,清華大學計算機科學與技術專業,工學碩士
1997/09–2001/7,清華大學計算機科學與技術系,學士

主要研究方向及成果簡介

近些年的主要研究方向關注在異構數據中心的編程和編譯最佳化。
在編程方面,主要關注異構數據中心中的編程環境,使得用戶能夠更關註上層套用邏輯,而無需擔心底層異構性所帶來的編程困擾。底層編程框架通過兩個方面來滿足用戶的需求:一是通過在Hadoop/Spark框架上提供加速器代碼外掛程式接口,使得大規模並行處理的套用能夠靈活的使用異構加速器;二是通過對不同計算、通路資源的行為進行建模,從而預測不同套用在獲取不同計算資源時的性能,從而實現資源在套用間更高效的分配。編程方面的主要成果Hadoop+被選為973項目子課題“片上並行系統的編程模型和支撐環境”的三個代表性成果之一。並獲得了國家重點研發計畫的支持,作為課題負責人承擔“基於數據流的大數據分析系統”課題“面向異構融合數據流加速器的編程模型及編譯器最佳化”。
在編譯方面,主要關注數據中心中QoS敏感的編譯最佳化方法,旨在通過Co-runner感知的編譯技術來生成性能高、co-run友好的代碼,協同提高數據中心的資源利用率。一方面,我們通過構建彈性代碼來動態調整數據中心套用的可執行代碼,另一方面我們通過面向特定領域的編譯最佳化方法來實施深度最佳化,儘可能逼近其峰值性能。編譯方面的主要成果包括自然基金項目“領域專家協同的並行編譯方法研究”(已結題),自然基金項目“數據中心中資源利用率敏感的編譯方法”,國家重點研發計畫“軟體定義的雲計算基礎理論與方法”中作為子課題負責人負責面向標籤的編程和編譯最佳化。

研究工作經歷

自2004年2月至今在中國科學院計算技術研究所從事研究工作,曾任研究實習員、助理研究員,現為中國科學院計算技術研究所副研究員,碩士生導師。在計算所工作期間,崔慧敏作為骨幹人員,先後參加了多項國家級以及橫向科研項目,主要有:X86到龍芯2號的二進制翻譯系統、X86到某Alpha晶片的二進制翻譯系統、龍芯3號虛擬機、973項目子課題“片上並行系統的編程模型和支撐環境”。崔慧敏目前的主要學術研究方向為多核/眾核晶片的編程模型、多核/眾核晶片的編譯最佳化、分散式並行計算。

已完成研究課題

2011年~2014年,作為課題負責人,參與華為橫向項目“高通量伺服器”的課題“雲開發環境”的研究。
2008年~2010年,作為項目骨幹,參與國家973項目“延長摩爾定律的微處理器晶片新原理、新結構與新方法研究”的課題“片上並行系統的編程模型與支撐環境”的研究,負責其中編譯框架的研究;
2004年~2008年,作為項目骨幹,參與研製支持某國產高性能晶片的二進制翻譯系統。

研究方向

異構數據中心編程,編譯最佳化

代表論著

申請人在中科院計算所攻讀博士學位和工作期間,一直從事多核/眾核編譯相關的研究,先後有相關的成果發表在JCST’10,CGO’11,IPDPS’11,IPDPS’12,TACO’12,TACO’13,PACT’13,CF’14,ICS’15,TPDS’16等國際著名的學術會議和期刊上。
部分代表性論著如下:
[1]LeiWang,FanYang,LiangjiZhuang,HuiminCui,FangLv,XiaobingFeng,
ArticulationPointsGuidedRedundancyEliminationforBetweennessCentralit,PPoPP’2016
[2]JiachengZhao,HuiminCui,JinglingXue,XiaobingFeng,PredictingCross-CorePerformanceInterferenceonMulticoreProcessorswithRegressionAnalysis,TPDS’2016
[3]WentingHe,HuiminCui,BinbinLu,JiachengZhao,ShengmeiLi,GongRuan,JinglingXue,XiaobingFeng,WensenYangandYouliangYan,Hadoop+:ModelingandEvaluatingtheHeterogeneityforMapReduceApplicationsinHeterogeneousClusters,ICS’2015
[4]QingYi,QianWang,HuiminCui,SpecializingCompilerOptimizationsThroughProgrammableCompositionForDenseMatrixComputations,MICRO’2014
[5]HuiminCui,GongRuan,JinglingXue,RuiXie,LeiWangandXiaobingFeng,ACollaborativeDivide-and-ConquerK-MeansClusteringAlgorithmforProcessingLargeData,CF2014
[6]FangLv,HuiminCui,LeiWang,LeiLiu,Cheng-GangWu,Xiao-BingFeng,andPen-ChungYew:DynamicI/O-AwareSchedulingforBatch-ModeApplicationsonChipMultiprocessorSystemsofClusterPlatforms.JCST2014
[7]HuiminCui,QingYi,JinglingXue,andXiaobingFeng."Layout-obliviouscompileroptimizationformatrixcomputations."ACMTransactionsonArchitectureandCodeOptimization(TACO)9,no.4(2013):35.
[8]JiachengZhao,HuiminCui,JinglingXue,XiaobingFeng,YouliangYan,andWensenYang."Anempiricalmodelforpredictingcross-coreperformanceinterferenceonmulticoreprocessors."InProceedingsofthe22ndinternationalconferenceonParallelarchitecturesandcompilationtechniques(PACT),pp.201-212.IEEEPress,2013.
[9]HuiminCui,QingYi,JinglingXue,LeiWang,YangYangandXiaobingFeng,Ahighly-parallelreusedistanceanalysisalgorithmonGPUs,IPDPS’12.
[10]HuiminCui,JinglingXue,LeiWang,YangYang,XiaobingFeng,DongruiFan:Extendablepattern-orientedoptimizationdirectives.TACO9(3):14(2012)
[11]YangYang,HuiminCui,XiaobingFeng,JinglingXue:AHybridCircularQueueMethodforIterativeStencilComputationsonGPUs.J.Comput.Sci.Technol.27(1):57-74(2012)
[12]HuiminCui,QingYi,JinglingXue,XiaobingFeng:Layout-obliviousoptimizationformatrixcomputations.PACT2012:429-430.
[13]HuiminCui,JinglingXue,LeiWang,YangYang,XiaobingFeng,andDongruiFan.ExtendablePattern-OrientedDirectives.CGO’11
[14]HuiminCui,LeiWang,JinglingXue,YangYang,andXiaobingFeng.AutomaticLibraryGenerationforBLAS3onGPUs.IPDPS’11
[15]HuiminCui,LeiWang,DongruiFanandXiaobingFeng.LandingStencilCodeonGodson-T.JJ.Comput.Sci.Technol.25(4)886-894(2010)
[16]LeiWang,HuiminCui,YueluDuan,FangLu,XiaobingFeng,Pen-ChungYew:Anadaptivetaskcreationstrategyforwork-stealingscheduling.CGO2010:266-277
[17]FangLv,LeiLiu,Hui-minCui,LeiWang,YingLiu,Xiao-bingFeng,Pen-ChungYew.WiseThrottling:anewasynchronoustaskschedulerformitigatingI/Obottleneckinlarge-scaledatacenterservers.April2015.
[18]CuiHM,WangL,FanDR,etal.ArchitectureandHighPerformanceComputerSystems<<PreviousArticles|[J].JournalofComputerScienceandTechnology,2010,25(4):886-894.
[19]Cui,Huimin,etal."AHighlyParallelReuseDistanceAnalysisAlgorithmonGPUs."19(2012):1080-1092.
[20]呂方、崔慧敏、霍瑋、馮曉兵,面向並發性能下降的調度策略的綜述,計算機研究與發展
[21]鄭亞松、王達、葉笑春、崔慧敏、徐遠超、范東睿,MALK:一種高效處理大規模鍵值的MapReduce框架,計算機研究與發展
[22]劉穎、呂方、王蕾、陳莉、崔慧敏、馮曉兵,異構並行編程模型研究與進展,軟體學報,25(7),pp1459-1475,2014
[23]王文文、武成崗、白童心、王振江、遠翔、崔慧敏,二進制翻譯中標誌位的模式化翻譯方法,計算機研究與發展,51(10),pp2336-2347,15/10/2014.
[24]武成崗、張兆慶、喬如良、馮曉兵、高琳、石學林、蔣弘山、崔慧敏,代碼翻譯中PERFORM和GOTO語句複合結構的變換,軟體學報,15(4),pp475-486,30/4/2004
[25]楊揚,崔慧敏,馮曉兵.面向GPU的循環合併[J].高技術通訊,2013,23(3):257-262.
[26]陳龍,武成崗,謝海斌,崔慧敏,張兆慶.二進制翻譯中解析多目標分支語句的圖匹配方法.計算機研究與發展,2008,(10):
[27]謝海斌,武成崗,崔慧敏,李晶.二進制翻譯中的X86浮點棧處理.計算機研究與發展,2007,44(11):1946-1954
[28]王蕾、崔慧敏、陳莉、馮曉兵,任務並行編程模型研究與進展,軟體學報,24(1),2013/8/13
[29]趙家程、崔慧敏、馮曉兵,基於統計學習分析多核間性能幹擾,軟體學報,24(11),2013/7/17.

專利

[1]數據中心資源分配方法、裝置及系統CN104184685A
[2]OpenCL運行時系統框架的設計方法及裝置CN104866295A
[3]一種擬合方法及擬合裝置CN103970719A(華為2013年優秀專利獎)
[4]一種最優網路最大流算法的選擇方法和設備CN104376366A
[5]一種程式運行性能分析方法及裝置CN103902443A
[6]一種數據處理的方法、裝置及系統CN104243531A(華為山頂專利)
[7]一種數據處理的方法和設備CN104252338A
[8]一種數據處理的方法及裝置CN105094981A
[9]一種有向圖的最小割獲取方法及設備CN104239126A
[10]網路流圖縮減方法和裝置CN104516995A
[11]一種數據處理方法及相關設備CN104731569A
[12]程式性能幹擾模型的確定方法及設備CN104424101A(華為正在申請國際專利)
[13]數據處理方法和中心節點CN105335135A(華為山頂專利)

相關詞條

相關搜尋

熱門詞條

聯絡我們