簡介
張量處理器(英語:tensor processing unit,縮寫:TPU)是Google為機器學習定製的專用晶片(ASIC),專為Google的深度學習框架TensorFlow而設計。
與圖形處理器(GPU)相比,TPU採用低精度(8位)計算,以降低每步操作使用的電晶體數量。降低精度對於深度學習的準確度影響很小,但卻可以大幅降低功耗、加快運算速度。同時,TPU使用了脈動陣列的設計,用來最佳化矩陣乘法與卷積運算,減少I/O操作。此外,TPU還採用了更大的片上記憶體,以此減少對DRAM的訪問,從而更大程度地提升性能。
Google在2016年的Google I/O年會上首次公布了TPU。不過在此之前TPU已在Google內部的一些項目中使用了一年多,如Google街景服務、RankBrain以及其旗下DeepMind公司的圍棋軟體AlphaGo等都用到了TPU。而在2017年的Google I/O年會上,Google又公布了第二代TPU,並將其部署在Google雲平台之上。第二代TPU的浮點運算能力高達每秒180萬億次。
世代
第一代
第一代的TPU使用8-bit矩陣乘法引擎,透過PCIe3.0與CISC指令操作。晶片為28nm製程,die≤ 331 mm,700 Mhz,功耗在28至40瓦。
第二代
第二代於2017年五月發表。
第三代
第三代於2018年五月發表。
專用積體電路
專用積體電路(英語: Application-specific integrated circuit,縮寫: ASIC),是指依產品需求不同而客制化的特殊規格積體電路;相反地,非客制化的是套用特定標準產品(Application-specific standard product)積體電路。
專用積體電路是由特定使用者要求和特定電子系統的需要而設計、製造。由於單個專用積體電路晶片的生產成本很高,如果出貨量較小,則採用專用積體電路在經濟上不太實惠。這種情況可以使用可程式邏輯器件(如現場可程式邏輯門陣列)來作為目標硬體實現積體電路設計。此外,可程式邏輯器件具有用戶可程式特性,因此適合於大規模晶片量產之前的原型機,來進行調試等工作。但是可程式邏輯器件在面積、速度方面的最佳化程度不如全定製的積體電路。
一般專用積體電路的ROM和RAM都在出廠前經過掩膜(MASK),如常用的紅外線遙控器發射晶片就是這種晶片。
專用積體電路的特點是面向特定用戶的需求,品種多、批量少,要求設計和生產周期短,它作為積體電路技術與特定用戶的整機或系統技術緊密結合的產物,與通用積體電路相比具有體積更小、重量更輕、功耗更低、可靠性提高、性能提高、保密性增強、成本降低等優點。