研究方向
並行算法與並行軟體,並行計算模型,性能最佳化和性能評測。
學習經歷
1991年9月-1995年7月,北京理工大學計算機科學與技術系計算機套用專業,工學學士;
1995年9月-2000年7月 中國科學院軟體研究所計算機軟體與理論專業碩博連讀,獲工學博士學位;
工作經歷
1991年9月-1995年7月,北京理工大學計算機科學與技術系計算機套用專業,獲工學學士學位;
1995年9月-2000年7月,中國科學院軟體研究所計算機軟體與理論專業碩博連讀,獲工學博士學位;
2000年7月-2001年12月,中科院軟體研究所並行軟體研究開發中心,並行算法與並行軟體,助研;
2002年1月-2007年3月,中科院軟體研究所並行軟體研究開發中心,並行算法與並行軟體,副研究員;
2003年5月2013年8月,中科院軟體研究所並行計算實驗室,並行算法與並行軟體,常務副主任;
2007年4月-2013年8月,中科院軟體研究所並行計算實驗室,並行算法與並行軟體,研究員;
2007年6月-2013年8月,中科院軟體研究所並行計算實驗室,並行算法與並行軟體,博士生導師。
2010年8月-2013年8月,中科院軟體所與AMD公司 “APU軟體聯合研究開發中心”主任。
2011年5月-2013年8月,中科院軟體所與美國Argonne國家實驗室數學與計算機科學部(MCS)“PPCT 聯合實驗室”(a JOINT LAB FOR Parallel PROcessing and computing techniques Research)中方主任。
2013年8月至今,中科院計算所計算機體系結構國家重點實驗室,研究員,博士生導師。
社會兼職
1、中國科大兼職教授;
2、中國軟體行業協會常務理事;
3、中國計算機學會理事、高性能計算專業委員會秘書長;
4、電子與電氣工程師協會(IEEE)會員;
獲獎情況
2005年到2011年中國軟體行業協會全國先進工作者
2010年中科院軟體所優秀指導教師獎。
2000年度中科院院長獎學金優秀獎。
2000年國家科技進步二等獎,排名第9位。
1998年中科院科技進步二等獎,排名第9位。
代表論著
已在國內外發表學術論文100餘篇,出版譯著二本,論著章節三章。其中SCI 4篇, ISTP 7篇,EI 38篇.在著名國際會議SC、PPoPP、Cluster、ECIR、IEEE ICPADS、Euro-Par、IEEE ICPP、ICA3PP、IEEE HPCC等發表過十多篇文章。
譯著
1. 張雲泉 張先軼 龍國平 姚繼鋒 譯, Benedict R. Gaster Lee Howes David R. Kaeli, Perhaad Mistry, Dana Schaa 著,《OpenCL異構計算》(Heterogeneous Computing with OpenCL),清華大學出版社,2012年6月。
2. 張雲泉,陳英 譯,(印)C.Xavier(美)S.S.Iyengar著,《並行算法導論》(Introduction to Parallel Algorithms),機械工業出版社/中信出版社,計算機科學叢書,ISBN 7-111-13390-0/TP.329,2004年2月北京第一版第一次印刷。
Books & Chapters
1.張雲泉,孫家昶,袁國興,張林波,“2004年高性能計算機發展趨勢分析與展望”, 《2004年中國計算機科學技術發展報告》第一篇《高性能計算機》,pp.1-22, 中國計算機學會學術工作委員會主編, 清華大學出版社,ISBN 7-302-11420-X,2005年8月。
2.張雲泉,孫家昶,袁國興,張林波,“2005年高性能計算機排行榜對比分析”, 《中國計算機科學技術發展報告2005》第一篇《計算機》,pp.3-25, 中國計算機學會文集(CCFP 0002),中國計算機學會學術工作委員會主編, 清華大學出版社,ISBN 7-302-13503-7/TP 8471,2006年8月。
3.張雲泉,孫家昶,袁國興,張林波,“2006年高性能計算機排行榜對比分析”, 《中國計算機科學技術發展報告2006》第一篇《高性能計算機》,pp.47-67, 中國計算機學會文集(CCFP 0005),中國計算機學會主編, 清華大學出版社,ISBN 978-7-302-16262-9,2007年11月。
期刊(Journal Paper)
1. Zhang Yunquan, Sun Jiachang, Yuan Guoxing, and Zhang Linbo. Perspectives of China’s HPC system development: a view from the 2009 China HPC TOP100 list. China: Frontiers of Computer Science in China, 2010. 437-444. 收錄於: SCI 收錄於: EI (601112w2r531)
2.孫相征, 張雲泉, 王宣強, 王磊. 數值軟體自適應性能最佳化搜尋過程評價技術研究. 計算機研究與發展, 2010, 47(4): 679-686. EI(201004015)
3. 劉勝飛, 張雲泉, 孫相征. 一種改進的OpenMP指導調度策略研究. 計算機研究與發展, 2010, 47(4): 687-694.EI(201004016)
4. 余元, 張雲泉, 李會元. 一類非張量積區域快速傅立葉變換算法在國產並行機上的可擴展性測試. 數值計算與計算機套用, 2010, 31(2): 123-130.
5. 孫相征, 張雲泉, 王婷, 楊超, 李力剛. 天體大規模數值模擬軟體性能最佳化. 華中科技大學學報(自然科學版), 2010, (1): 51-54.
6. Chen Shao-Hu, Zhang Yunquan, Zhang Xian-Yi, and Cheng Hao. Performance Testing And Analysis Of Blas Libraries On Multi-core Cpus. Ruan Jian Xue Bao/Journal of Software, 2010, 21(SUPPL. 1): 214-223. EI (20111013735688)
7. Yuan Liang, Zhang Yunquan, Long Guo-Ping, Wang Ke, and Zhang Xian-Yi. A Gpu Computational Model Based On Latency Hidden Factor. Ruan Jian Xue Bao/Journal of Software, 2010, 21(SUPPL. 1): 251-262. EI (20111013735691)
8. 王婷, 孫相征, 張雲泉, 楊超, 李力剛, 劉芳芳, 管文華, 唐雨新, 姚繼峰. 曙光5000A天體大規模數值模擬軟體性能測試. 西安交通大學學報, 2009, 43(10): 71-75.
9.袁娥, 張雲泉, 劉芳芳, 孫相征. SpMV的自動性能最佳化實現技術及其套用研究. 計算機研究與發展, 2009, 46(7): 1117-1126.EI(200907007)
10. Tang, Yuxin, Zhang Yunquan, and Chen, Hu. A Parallel Shortest Path Algorithm Based On Graph-partitioning And Iterative Correcting. COMPUTER SYSTEMS SCIENCE AND ENGINEERING, 2009, 24(5): 351-360.(SCI)
11. Zhang Jian, Zhang Wenhui, Zhan Naijun, Shen Yidong, Chen Haiming, Zhang Yunquan, Wang Yongji, Wu Enhua, Wang Hongan, and Zhu Xueyang. Basic Research In Computer Science And Software Engineering At Sklcs. Frontiers of Computer Science in China, 2008, 2(1): 1-11. EI(20081511188751)
12. 陳虎, 張雲泉, 柳鍇, 李玉成. 基於機群架構的並行資料庫中間件系統改進研究. 計算機研究與發展, 2007, 44(z3): 142-146.
13. Zhang Yunquan, Chen Guoliang, Sun Guangzhong, and Miao Qiankun. Models Of Parallel Computation: A Survey And Classification. Frontiers of Computer Science in China, 2007, 1(2): 156-165. EI (20074811741394)
14. 陳靖, 張雲泉, 張林波, 袁偉. 一種新的MPI Allgather算法及其在萬億次機群系統上的實現與性能分析. 計算機學報, 2006, 29(5): 808-814.EI (200605017)
15. Chen Guo-Liang, Sun Guang-Zhong, Zhang Yunquan, and Mo Ze-Yao. Study On Parallel Computing. Journal of Computer Science and Technology, 2006, 21(5): 665-673. (SCI) EI (20064310193819)
16.袁偉, 張雲泉, 孫家昶, 李玉成. 國產萬億次機群系統NPB性能測試分析. 計算機研究與發展, 2005, 42(6): 1079-1084.EI (200506027)
17. 唐淵, 孫家昶, 張雲泉, 張林波. 集群網路評測模型的新探索. 軟體學報, 2005, 16(6): 1131-1139.EI (200506012)
18. 張廣治, 張雲泉, 李偉華, 李玉成. FM-index算法性能測試及並行化. 計算機工程, 2005, 31(22): 51-53.EI (200522018)
19. 張雲泉. 面向高性能數值計算的並行計算模型DRAM(h). 計算機學報, 2003, 26(12): 1660-1670.EI (200312007)
20. 張雲泉, 孫家昶, 唐志敏, 遲學斌. 數值計算程式的存儲複雜性分析. 計算機學報, 2000, 23(4): 363-373.
21. 張雲泉, 施巍松. 負載平衡無關的並行程式最適處理器格線選擇. 軟體學報, 2000, 11(12): 1674-1680.
22. 熊玉慶, 張雲泉. 並行計算通信庫測試方法研究及實踐. 軟體學報, 2000, 11(12): 1681-1684.
23. 張雲泉, 遲學斌. 在PVM應用程式中調用ScaLAPACK庫函式方法. 數值計算與計算機套用, 1999, (4): 274-282.
24. Yan Li, Yunquan Zhang, Yi-Qun Liu, Guoping Long, Haipeng Jia: MPFFT: An Auto-Tuning FFT Library for OpenCL GPUs. J. Comput. Sci. Technol. 28(1): 90-105 (2013)(SCI)
25. Wang, Weiyan; Zhang, Yunquan; Yan, Shengen; Zhang, Ying; Jia, Haipeng, Parallelization and performance optimization on face detection algorithm with OpenCL: A case study,Tsinghua Science and Technology , Vol.17, No.3, pp.287-295, 2012.
會議(Conference Paper)
1.Sun Xiangzheng, Zhang Yunquan, Wang Ting, Long Guoping, Zhang Xianyi, and Li Yan. Crsd: Application Specific Auto-tuning Of Spmv For Diagonal Sparse Matrices. In: Euro-Par 2011 Parallel Processing. 2011. 316-327.
2. Yang Chao, Li Ligang, and Zhang Yunquan. Development of a Scalable Solver for the Earth’s Core Convection. In: High Performance Computing and Applications. Germany: HIGH PERFORMANCE COMPUTING AND APPLICATIONS, 2010. 497-502. 收錄於: ISTP 收錄於: EI (11193g703466716r)
3. Yang Chao, Zhang Yunquan, and Li Ligang. Numerical Simulation Of The Thermal Convection In The Earth's Outer Core. In: Proceedings - 2010 12th IEEE International Conference on High Performance Computing and Communications, HPCC 2010. United States: 2010. 552-555. EI (20104613376545)
4.Wang Lei, Zhang Yunquan, Zhang Xianyi, and Liu Fangfang. Accelerating Linpack Performance With Mixed Precision Algorithm On Cpu+gpgpu Heterogeneous Cluster. In: Proceedings - 10th IEEE International Conference on Computer and Information Technology, CIT-2010, 7th IEEE International Conference on Embedded Software and Systems, ICESS-2010, ScalCom-2010. United States: 2010. 1169-1174. EI (20104613393066)
5 Wang Jing, Zhang Yunquan, Zhang Xianyi, Sun Xiangzheng, and Sheng Quanhu. Quantwiz: A Scalable Parallel Software Package For Label-free Protein Quantification. In: Proceedings 2010 IEEE 5th International Conference on Bio-Inspired Computing: Theories and Applications, BIC-TA 2010. United States: 2010. 976-980. EI (20105213534210)
6.Wang Jing, Zhang Yunquan, Zhang Xianyi, Sun Xiangzheng, Hu Zelin, Li Sujun, and Zeng Rong. Quantwiz: A Parallel Software Package For Lc-ms-based Label-free Protein Quantification. In: 2009 11th IEEE International Conference on High Performance Computing and Communications, HPCC 2009. United States: HPCC: 2009 11TH IEEE INTERNATIONAL CONFERENCE ON HIGH PERFORMANCE COMPUTING AND COMMUNICATIONS, 2009. 683-687. ISTP,EI (20094712487667)
7. Yu Yuan, Zhang Yunquan, Wang Ting, Sun Jiachang, Zhang Xianyi, Tang Yuxin, and Rao Li. Early Performance Evaluation Of Dawning 5000a And Deepcomp 7000. In: Proceedings of the International Conference on Parallel and Distributed Systems - ICPADS. United States: 2009. 578-585. EI (20101212791530)
8. Liu Shengfei, Zhang Yunquan, Sun, Xiangzheng, and Qiu, RongRong. Performance Evaluation Of Multithreaded Sparse Matrix-vector Multiplication Using Openmp. 345 E 47TH ST, NEW YORK, NY 10017 USA: HPCC: 2009 11TH IEEE INTERNATIONAL CONFERENCE ON HIGH PERFORMANCE COMPUTING AND COMMUNICATIONS, 2009. 659-665.
9.Zhang Di, Zhang Yunquan, Liu Shengfei, and Huang Xiaodi. Parallelization Of Fm-index. In: Proceedings - 10th IEEE International Conference on High Performance Computing and Communications, HPCC 2008. United States: HPCC 2008: 10TH IEEE INTERNATIONAL CONFERENCE ON HIGH PERFORMANCE COMPUTING AND COMMUNICATIONS, PROCEEDINGS, 2008. 169-173. ISTP, EI (20084811737714)
10. Tang Yuan, and Zhang Yunquan. Utilizing The Multi-threading Techniques To Improve The Two-level Checkpoint/rollback System For Mpi Applications. In: Proceedings - 10th IEEE International Conference on High Performance Computing and Communications, HPCC 2008. United States: 2008. 864-869. EI (20084811737808)
11.Tang Yuxin, Zhang Yunquan, and Chen Hu. A Parallel Shortest Path Algorithm Based On Graph-partitioning And Iterative Correcting. In: Proceedings - 10th IEEE International Conference on High Performance Computing and Communications, HPCC 2008. United States: HPCC 2008: 10TH IEEE INTERNATIONAL CONFERENCE ON HIGH PERFORMANCE COMPUTING AND COMMUNICATIONS, PROCEEDINGS, 2008. 155-161. ISTP,EI (20084811737712)
12. Zhang Yunquan, Jiachang Sun, Guoxing Yuan, and Zhang Linbo. A Brief Introduction To China Hpc Top100: From 2002 To 2006. In: CHINA HPC 2007: Proceedings of the Asian Technology Information Program's (ATIP's) 3rd Workshop on High Performance Computing in China - Solution Approaches to Impediments for High Performance. United States: 2007. 32-36. EI (20085011783002)
13. Di Zhang, Zhang Yunquan, and Jing Chen. Efficient Construction Of Fm-index Using Overlapping Block Processing For Large Scale. In: Lecture Notes in Computer Science (including subseries Lecture Notes in Artificial Intelligence and Lecture Notes in Bioinformatics). Germany: 2007. 113-123. EI (20075110984449)
14.Zhang Yunquan, Chen Ying, and Tang Yuan. Block Size Selection Of Parallel LU And QR on PVP-based And Risc-based Supercomputers. In: CHINA HPC 2007: Proceedings of the Asian Technology Information Program's (ATIP's) 3rd Workshop on High Performance Computing in China - Solution Approaches to Impediments for High Performance. United States: 2007. 115-125. EI (20085011783014)
15.Zhang, Di, Zhang Yunquan, and Chen, Jing. Efficient Construction Of Fm-index Using Overlapping Block Processing For Large Scale Texts. In: Advances in Information Retrieval. HEIDELBERGER PLATZ 3, D-14197 BERLIN, GERMANY: Advances in Information Retrieval, 2007. 113-123. ISTP
16.張雲泉, 孫家昶, 袁國興, 張林波. 2004年高性能計算機發展趨勢分析與展望. 上海: 中國計算機學會, 2005.
17.Chen Jing, Zhang Linbo, Zhang Yunquan, and Yuan Wei. Performance Evaluation Of Allgather Algorithms On Terascale Linux Cluster With Fast Ethernet. In: Proceedings - Eighth International Conference on High-Performance Computing in Asia-Pacific Region, HPC Asia 2005. United States: 2005. 437-442. EI (20070910439446)
18. Zhang Yunquan. Performance Characteristics Of Itanium2 And Opteron For Numerical Scientific Computing: A Common User's View. MARITIME GREENWICH CAMPUS, OLD ROYAL NAVAL COLLEGE, PARK ROW, LONDON, SE10 9LS, ENGLAND: DCABES and ICPACE Joint Conference on Distributed Algorithms for Science and Engineering, 2005. 85-88. ISTP
19. Tang Yuan, Zhang Yunquan, Sun Jia-Chang, and Li Yu-Cheng. Hardware Impact On Communication Performance Of Beowulf Linux Cluster. In: IASTED International Multi-Conference on Applied Informatics. 2003. 495-500. EI (2004128066617)
20. Shengen Yan, Guoping Long, Yunquan Zhang: StreamScan: fast scan algorithms for GPUs without global barrier synchronization. PPOPP 2013: 229-238.Shenzhen, China.
21. Xianyi Zhang, Qian Wang, Yunquan Zhang, Model-driven Level 3 BLAS Performance Optimization on Loongson 3A Processor, ICPADS 2012, Singapore.
22. Liang Yuan, Yunquan Zhang: A Locality-based Performance Model for Load-and-Compute Style Computation. CLUSTER 2012: 566-571
23. Haipeng Jia, Yunquan Zhang, Guoping Long, Jianliang Xu, Shengen Yan, Yan Li: GPURoofline: A Model for Guiding Performance Optimizations on GPUs. Euro-Par 2012: 920-932
24. Haipeng Jia, Yunquan Zhang, Weiyan Wang, Jianliang Xu: Accelerating Viola-Jones Facce Detection Algorithm on GPUs. HPCC 2012: 396-403
25. Haipeng Jia, Yunquan Zhang, Guoping Long, Shengen Yan: An Insightful Program Performance Tuning Chain for GPU Computing. ICA3PP (1) 2012: 502-516
26. Liang Yuan, Chen Ding, Daniel tefankovic, Yunquan Zhang: Modeling the Locality in Graph Traversals. ICPP 2012: 138-147
27. Chao Li, Yunquan Zhang, Changwen Zheng, Xiaohui Hu: Implementing High-performance Intensity Model with Blur Effect on GPUs for Large-scale Star Image Simulation. IPDPS Workshops 2012: 1879-1888
28. Qian Wang, Xianyi Zhang, Yunquan Zhang, Qing Yi. AUGEM: Automatically Generate High Performance Dense Linear Algebra Kernels on x86 CPUs. SC 2013. Nov.16-22, 2013, Denver, USA.
科研項目
1. 1994-1998,攀登計畫B《高性能計算機若干關鍵技術基礎性研究》,項目組成員;
2. 1996-2000,中科院與日本日立公司國際合作項目《日立千億次並行機SR2201上ScaLAPACK加速版的研究與開發》和《日立萬億次並行機SR8000上ScaLAPACK加速版的研究與開發》,骨幹;
3. 1998-2000,國家863項目《分散式大規模數值並行理論與算法研究》(863-306-ZT06-02-1),骨幹;
4. 1999-2001,國家自然科學基金項目《提高分散式並行數值軟體性能的若干關鍵技術研究》(編號69883006),骨幹;
5. 2001-2002,中科院計算機科學重點實驗室青年科學基金項目SYSQN0101-《基於存儲複雜性的並行計算模型研究》,項目負責人;
6. 2001-2004,國家重點基礎研究發展規劃項目(973)《大規模科學計算研究》項目子課題《大規模計算工程軟體系統的基礎理論和實施》(G1999032805),項目組骨幹成員;
7. 國家自然科學基金面上項目青年科學基金項目《萬億次並行計算系統性能評價分析最佳化關鍵技術》(NO.60303020),2004.1-2006.12,項目負責人。
8. 中國科學院知識創新工程重大項目(審計署與中國科學院合作研究項目),《聯網審計技術研究與套用》(KSH1-02)課題《壓縮查詢技術研究及其套用》,2005.4-2008.11,課題負責人。
9. 國家自然科學基金重點項目《當代並行機的並行算法套用基礎研究》(NO.60533020),負責人:陳國良院士,2006.1-2009.12,項目骨幹。
10. 國防軍工課題,高性能擴展數學庫合作研發,2006.1-208.6,課題負責人。
11. 中國科學院知識創新工程重大項目《面向生命科學前沿的高性能計算研究》課題《高性能蛋白質定量計算軟體平台構建與開發》,2008.1-2010.12,課題負責人。
12. 國家863“高效能計算機及格線服務環境”重大項目課題,《天體大規模並行數值計算軟體平台的研製》(No.2006AA01A125) ,2008.1-2010.12,課題組副組長。
13. 國家重大科研裝備研製項目《高效能低成本多尺度離散模擬超級計算套用系統》支撐軟體合作研究課題《基於GPGPU的高性能計算系統Linpack性能評測軟體包研製》,2009.5 – 2009.12,課題負責人。
14. 中科院軟體所傑出青年人才專項計畫,2009.9-2013.9,張雲泉;
15. 國防軍工課題,多核版高性能擴展數學庫合作研發,2009.1-2011.6,課題負責人。
16. 核高基重大專項(軟體類)《支持國產CPU的編譯系統及工具鏈》子課題《龍芯CPU多核並行國產高性能數學庫研究開發》(2009ZX01036-001-002-3), 2009.1-2011.6,子課題組組長。
17. 國家863“高效能計算機及格線服務環境”重大專項課題,《曙光6000千萬億次高效能計算機系統研製》子課題《面向數萬個以上處理器的新型基礎算法研究》(No. 2009AA01A129), 2009.1-2010.12,子課題組組長。
18. 國家863 “高效能計算機及格線服務環境”重大項目課題,《面向千萬億次計算機的並行算法庫研製》(No. 2009AA01A134)《面向國產算法庫的千萬億次大規模並行算法和性能最佳化方法研究》, 2009.1-2010.12,課題組副組長。
19. 國防科工局民用航天專業技術預先研究項目,基於光線追蹤的高精度成像並行數值計算軟體,2011.7-2013.12,課題負責人。
20. 國際企業橫向合作項目,特定HPC套用及OPENCV的移植和最佳化(AMD), 2011.1-2012.12,課題負責人,
21. 國家自然基金重點基金,《大規模異構並行系統的調度理論與方法》(No.61133005),2012.1-2016.12,子課題負責人。
22. 國家自然科學基金面上項目“眾核體系架構並行計算模型與算法自適應調優框架研究”(No.61272136) , 2013.1至2016.12,課題負責人。