作者介紹
Gene Kim
Tripwire創始人、前CTO,IT Revolution創始人,DevOps企業峰會主辦人,暢銷書《鳳凰項目》合著者。
Jez Humble
DevOpsResearch and Assessment公司CTO,加州大學伯克利分校信息學院講師;曾任ThoughtWorks首席顧問。《精益企業》和Jolt大獎圖書《持續交付》的合著者。
Patrick Debois
DevOps之父,致力於通過在開發、項目管理和系統管理之中套用敏捷技術來填補項目和運維之間的鴻溝。
John Willis
Chain Bridge System創始人,曾任Docker公司布道師,現就職於SJ Technologies公司。
譯者簡介
劉征
DevOps教練,EXIN首批國內DevOps Master和DevOps Professional認證講師,持有紅帽RHCA認證和AWS高級架構師認證,諳熟企業數據中心的IT服務管理。致力於推廣DevOps相關的理念和實踐,在DevOps社區中積極地參與培訓和研討會等活動,是DevOpsDays大會社區在中國的核心組織者和志願工作者。
王磊
前ThoughtWorks諮詢師,EXIN首批國內DevOps Master認證講師。擁有10多年軟體行業經驗,以及服務化架構、持續交付和DevOps轉型等方面的豐富實踐經驗。國內較早倡導和實踐微服務的先行者,著有國內首本微服務架構相關圖書《微服務架構與實踐》,是西安DevOps Meetup活動的聯合發起人。
馬博文
前ThoughtWorks諮詢師,AWS認證助理架構師、開發者。擁有多年Web開發和DevOps經驗,熟悉持續交付、微服務。曾參與翻譯《Scala編程實戰》《DevOps實踐》等書,是西安DevOps Meetup活動的發起人。
曾朝京
Micro Focus資深解決方案顧問,曾參加EXIN首批國內DevOps Master講師認證培訓。長期從事IT運維管理領域諮詢工作,曾為能源、金融、航空運輸、政府行業中的多個大型企業提供IT運維管理規劃。致力於探索DevOps理念在企業IT部門的實踐。
目錄
第 一部分 DevOps介紹
第 1章 敏捷、持續交付和三步法 4
1.1 製造業價值流 4
1.2 技術價值流 4
1.2.1 聚焦於部署前置時間 5
1.2.2 關注返工指標——%C/A 7
1.3 三步工作法:DevOps的基礎原則 7
1.4 小結 8
第 2章 第 一步:流動原則 9
2.1 使工作可見 9
2.2 限制在制品數 10
2.3 減小批量大小 11
2.4 減少交接次數 13
2.5 持續識別和改善約束點 14
2.6 消除價值流中的困境和浪費 15
2.7 小結 16
第3章 第二步:反饋原則 17
3.1 在複雜系統中安全地工作 17
3.2 及時發現問題 18
3.3 群策群力,戰勝問題獲取新知 19
3.4 在源頭保障質量 21
3.5 為下游工作中心而最佳化 22
3.6 小結 22
第4章 第三步:持續學習與實驗原則 23
4.1 建立學習型組織和安全文化 23
4.2 將日常工作的改進制度化 25
4.3 把局部發現轉化為全局最佳化 26
4.4 在日常工作中注入彈性模式 27
4.5 領導層強化學習文化 27
4.6 小結 29
4.7 第 一部分總結 29
第二部分 從何處開始
第5章 選擇合適的價值流作為切入點 32
5.1 綠地項目與棕地項目 34
5.2 兼顧記錄型系統和互動型系統 35
5.3 從最樂於創新的團隊開始 36
5.4 擴大DevOps的範圍 37
5.5 小結 38
第6章 理解、可視化和運用價值流 39
6.1 確定創造客戶價值所需的團隊 40
6.2 針對團隊工作繪製價值流圖 40
6.3 組建專門的轉型團隊 42
6.3.1 擁有共同的目標 43
6.3.2 保持小跨度的改進計畫 44
6.3.3 為非功能性需求預留20%的開發時間,減少技術債務 44
6.3.4 提高工作的可視化程度 47
6.4 用工具強化預期行為 47
6.5 小結 48
第7章 參考康威定律設計組織結構 49
7.1 組織原型 51
7.2 過度職能導向的危害(“成本最佳化”) 51
7.3 組建以市場為導向的團隊(“速度最佳化”) 52
7.4 使職能導向有效 53
7.5 將測試、運維和信息安全融入日常工作 54
7.6 使團隊成員都成為通才 54
7.7 投資於服務和產品,而非項目 56
7.8 根據康威定律設定團隊邊界 56
7.9 創建松耦合架構,提高生產力和安全性 57
7.10 小結 60
第8章 將運維融入日常開發工作 61
8.1 創建共享服務,提高開發生產力 62
8.2 將運維工程師融入服務團隊 63
8.3 為每個服務團隊分派運維聯絡人 64
8.4 邀請運維工程師參加開發團隊的會議 65
8.4.1 邀請運維工程師參加每日站會 65
8.4.2 邀請運維工程師參加回顧會議 66
8.4.3 使用看板圖展示運維工作 66
8.5 小結 67
8.6 第二部分總結 67
第三部分 第 一步:流動的技術實踐
第9章 為部署流水線奠定基礎 70
9.1 按需搭建開發環境、測試環境和生產環境 71
9.2 套用統一的代碼倉庫 72
9.3 使基礎設施的重建更容易 74
9.4 運行在類生產環境裡才算“完成” 75
9.5 小結 76
第 10章 實現快速可靠的自動化測試 77
10.1 對代碼和環境做持續構建、測試和集成 79
10.2 構建快速可靠的自動化測試套件 81
10.2.1 在自動化測試中儘早發現錯誤 83
10.2.2 儘可能並行地快速執行測試 84
10.2.3 先編寫自動化測試 84
10.2.4 儘量將手動測試自動化 85
10.2.5 在測試套件中集成性能測試 86
10.2.6 在測試套件中集成非功能性需求測試 86
10.3 在部署流水線失敗時拉下安燈繩 87
10.4 小結 89
第 11章 套用和實踐持續集成 90
11.1 小批量開發與大批量合併 92
11.2 套用基於主幹的開發實踐 93
11.3 小結 95
第 12章 自動化和低風險發布 96
12.1 自動化部署流程 97
12.1.1 套用自動化的自助式部署 100
12.1.2 在部署流水線中集成代碼部署 101
12.2 將部署與發布解耦 104
12.2.1 基於環境的發布模式 105
12.2.2 基於套用的發布模式更安全 109
12.3 持續交付和持續部署實踐的調查 112
12.4 小結 113
第 13章 降低發布風險的架構 114
13.1 能提高生產力、可測試性和安全性的架構 115
13.2 架構原型:單體架構與微服務 116
13.3 安全地演進企業架構 118
13.4 小結 121
13.5 第三部分總結 121
第四部分 第二步:反饋的技術實踐
第 14章 建立能發現並解決問題的遙測系統 125
14.1 建設集中式監控架構 127
14.2 建立生產環境的應用程式日誌遙測 129
14.3 使用遙測指導問題的解決 131
14.4 將建立生產遙測融入日常工作 132
14.5 建立自助訪問的遙測和信息輻射器 133
14.6 發現和填補遙測的盲區 135
14.6.1 應用程式和業務度量指標 136
14.6.2 基礎架構度量指標 137
14.6.3 顯示疊加的指標組合 138
14.7 小結 139
第 15章 分析遙測數據以更好地預測故障和實現目標 140
15.1 用均值和標準差識別潛在問題 141
15.2 異常狀態的處理和告警 142
15.3 非高斯分布遙測數據的問題 143
15.4 套用異常檢測技術 146
15.5 小結 149
第 16章 套用反饋實現安全部署 150
16.1 通過遙測使部署更安全 151
16.2 開發和運維共同承擔值班工作 153
16.3 讓開發人員跟蹤工作對下游的影響 153
16.4 讓開發人員自行管理生產服務 155
16.5 小結 159
第 17章 將假設驅動的開發和A/B測試融入日常工作 160
17.1 A/B測試簡史 161
17.2 在功能測試中集成A/B測試 162
17.3 在發布中集成A/B測試 162
17.4 在功能規劃中集成A/B測試 163
17.5 小結 165
第 18章 建立評審和協作流程以提升當前工作的質量 166
18.1 變更審批流程的危險 168
18.2 “過度控制變更”的潛在危險 168
18.3 變更的協調和排程 170
18.4 變更的同行評審 170
18.5 人工測試和變更凍結的潛在危害 173
18.6 利用結對編程改進代碼變更 173
18.7 消除官僚流程 176
18.8 小結 177
18.9 第四部分總結 178
第五部分 第三步:持續學習與實驗的技術實踐
第 19章 將學習融入日常工作 180
19.1 建立公正和學習的文化 181
19.2 舉行不指責的事後分析會議 182
19.3 儘可能廣泛地公開事後分析會議結果 184
19.4 降低事故容忍度,尋找更弱的故障信號 185
19.5 重新定義失敗,鼓勵評估風險 186
19.6 在生產環境注入故障來恢復和學習 186
19.7 創建故障演練日 187
19.8 小結 189
第 20章 將局部經驗轉化為全局改進 190
20.1 使用聊天室和聊天機器人自動積累組織知識 190
20.2 軟體中便於重用的自動化、標準化流程 192
20.3 創建全組織共享的單一原始碼庫 192
20.4 運用自動化測試記錄和交流實踐來傳播知識 194
20.5 通過確定非功能性需求來設計運維 194
20.6 把可重用的運維用戶故事納入開發 195
20.7 確保技術選型有助於實現組織目標 195
20.8 小結 197
第 21章 預留組織學習和改進的時間 198
21.1 償還技術債務的制度化慣例 199
21.2 讓所有人教學相長 200
21.3 在DevOps會議中分享經驗 201
21.4 傳播實踐的內部顧問和教練 203
21.5 小結 204
21.6 第五部分總結 204
第六部分 集成信息安全、變更管理和合規性的技術實踐
第 22章 將信息安全融入每個人的日常工作 207
22.1 將安全集成到開發疊代的演示中 207
22.2 將安全集成到缺陷跟蹤和事後分析會議中 208
22.3 將預防性安全控制集成到共享原始碼庫及共享服務中 208
22.4 將安全集成到部署流水線中 209
22.5 保證應用程式的安全性 210
22.6 確保軟體供應鏈的安全 214
22.7 確保環境的安全 215
22.8 將信息安全集成到生產環境遙測中 216
22.9 在應用程式中建立安全遙測系統 217
22.10 在環境中建立安全遙測系統 217
22.11 保護部署流水線 219
22.12 小結 219
第 23章 保護部署流水線 220
23.1 將安全和合規性集成到變更批准流程中 220
23.2 將大量低風險變更重新歸類為標準變更 221
23.3 如何處理常規變更 222
23.4 減少對職責分離的依賴 224
23.5 確保為審計人員和合規人員留存文檔和證據 226
23.6 小結 228
23.7 第六部分總結 228
行動起來——本書總結 229
附加材料
附 錄 232
附錄1 DevOps的大融合 232
附錄2 約束理論和核心的長期衝突 234
附錄3 惡性循環列表 235
附錄4 交接和佇列的危害 235
附錄5 工業安全神話 236
附錄6 豐田安燈繩 237
附錄7 軟體包產品 238
附錄8 事後分析會議 238
附錄9 猿猴軍團 239
附錄10 上線時間透明化 240
參考資源 241
致 謝 243
EXIN DevOps Professional認證備考指南&模擬題 245
內容簡介
以下內容來源於原出版社。
為什麼要做DEVOPS
The effective management of technology is critical for business competitiveness. High-performing organizations are 2.5x more likely than their peers to exceed profitability, market share, and productivity goals.
價值流和工作三步法
We introduce the underpinning theory and primer of Lean Manufacturing, as well as the broader princples of the Three Ways—the principles from which all of the observed DevOps behaviors can be derived.
從哪裡開始
We will discuss where to start, who will be involved, and how to protect, organize, and enable our teams.
加速度流動
We sustain the fast flow of work from Dev into Ops, without causing chaos and disruption to the production environment and customers.
加速度反饋
We shorten and amplify feedback loops, radiating feedback and making information visible to everyone in the value stream.
加速度學習
We continually shorten and amplify our feedback loops, relentlessly creating ever safer systems of work.