基本內容
原書名:Surreptitious Software:Obfuscation, Watermarking,and Tamperproofing for Software Protection
原出版社:Pearson Education
作者:
(美)Christian CollbergJasvir Nagra譯者:崔孝晨
叢書名:
圖靈程式設計叢書出版社:人民郵電出版社
ISBN:
9787115270757出版日期:2012 年5月
開本:16開
頁碼:578
版次:1-1
內容簡介
《軟體加密與解密》介紹了如何利用混淆、水印和防篡改等技術,來保護軟體免受盜版、篡改和惡意逆向工程的危害,主要內容包括攻擊者和防禦者用來分析程式的各種主流方法,如何使用代碼混淆技術使程式更難以被分析和理解,如何在軟體中添加水印和指紋以標識軟體的開發者和購買用戶,等等。
《軟體加密與解密》適合各層次軟體開發人員閱讀。
目錄
《軟體加密與解密》
第1章 什麼是隱蔽軟體 1
1.1 概述 1
1.2 攻擊和防禦 5
1.3 程式分析的方法 6
1.4 代碼混淆 11
1.4.1 代碼混淆的套用 13
1.4.2 混淆技術概述 17
1.4.3 被黑客們使用的代碼混淆技術 21
1.5 防篡改技術 27
1.5.1 防篡改技術的套用 27
1.5.2 防篡改技術的例子 29
1.6 軟體水印 30
1.6.1 軟體水印的例子 32
1.6.2 攻擊水印系統 34
1.7 軟體相似性比對 36
1.7.1 代碼剽竊 36
1.7.2 軟體作者鑑別 37
1.7.3 軟體“胎記” 38
1.7.4 軟體“胎記”的案例 40
.1.8 基於硬體的保護技術 41
1.8.1 把硬體加密鎖和軟體一起發售 42
1.8.2 把程式和cpu綁定在一起 43
1.8.3 確保軟體在安全的環境中執行 43
1.8.4 加密執行檔 44
1.8.5 增添物理防護 45
1.9 小結 46
1.9.1 使用軟體保護技術的理由 46
1.9.2 不使用軟體保護技術的理由 47
1.9.3 那我該怎么辦呢 47
1.10 一些說明 48
第2章 攻擊與防禦的方法 49
2.1 攻擊的策略 50
2.1.1 被破解對象的原型 50
2.1.2 破解者的動機 52
2.1.3 破解是如何進行的 54
2.1.4 破解者會用到的破解方法 55
2.1.5 破解者都使用哪些工具 58
2.1.6 破解者都會使用哪些技術 59
2.1.7 小結 69
2.2 防禦方法 70
2.2.1 一點說明 71
2.2.2 遮掩 73
2.2.3 複製 75
2.2.4 分散與合併 78
2.2.5 重新排序 80
2.2.6 映射 81
2.2.7 指引 84
2.2.8 模仿 85
2.2.9 示形 87
2.2.10 條件—觸發 88
2.2.11 運動 90
2.2.12 小結 91
2.3 結論 92
2.3.1 對攻擊/防禦模型有什麼要求 92
2.3.2 該如何使用上述模型設計算法 93
第3章 分析程式的方法 94
3.1 靜態分析 95
3.1.1 控制流分析 95
3.1.2 數據流分析 103
3.1.3 數據依賴分析 107
3.1.4 別名分析 109
3.1.5 切片 115
3.1.6 抽象解析 116
3.2 動態分析 118
3.2.1 調試 118
3.2.2 剖分 129
3.2.3 trace 132
3.2.4 模擬器 135
3.3 重構源碼 137
3.3.1 反彙編 139
3.3.2 反編譯 146
3.4 實用性分析 155
3.4.1 編程風格度量 156
3.4.2 軟體複雜性度量 158
3.4.3 軟體可視化 159
3.5 小結 162
第4章 代碼混淆 163
4.1 保留語義的混淆轉換 164
4.1.1 算法obfcf:多樣化轉換 164
4.1.2 算法obftp:標識符重命名 170
4.1.3 混淆的管理層 173
4.2 定義 177
4.2.1 可以實用的混淆轉換 178
4.2.2 混淆引發的開銷 181
4.2.3 隱蔽性 181
4.2.4 其他定義 182
4.3 複雜化控制流 183
4.3.1 不透明表達式 183
4.3.2 算法obfwhkd:壓扁控制流 184
4.3.3 使用別名 186
4.3.4 算法obfctjbogus:插入多餘的控制流 191
4.3.5 算法obfldk:通過跳轉函式執行無條件轉移指令 195
4.3.6 攻擊 198
4.4 不透明謂詞 201
4.4.1 算法obfctjpointer:從指針別名中產生不透明謂詞 202
4.4.2 算法obfwhkdopaque:數組別名分析中的不透明值 204
4.4.3 算法obfctjthread:從並發中產生的不透明謂詞 205
4.4.4 攻擊不透明謂詞 207
4.5 數據編碼 211
4.5.1 編碼整型數 213
4.5.2 混淆布爾型變數 217
4.5.3 混淆常量數據 220
4.5.4 混淆數組 222
4.6 結構混淆 226
4.6.1 算法obfwcsig:合併函式簽名 226
4.6.2 算法obfctjclass:分解和合併類 229
4.6.3 算法obfdmrvsl:摧毀高級結構 232
4.6.4 算法obfajv:修改指令編碼方式 239
4.7 小結 243
第5章 混淆理論 245
5.1 定義 248
5.2 可被證明是安全的混淆:我們能做到嗎 249
5.2.1 圖靈停機問題 250
5.2.2 算法reaa:對程式進行反混淆 252
5.3 可被證明是安全的混淆:有時我們能做到 254
5.3.1 算法obflbs:混淆點函式 254
5.3.2 算法obfns:對資料庫進行混淆 261
5.3.3 算法obfpp:同態加密 263
5.3.4 算法obfcejo:白盒des加密 267
5.4 可被證明是安全的混淆:(有時是)不可能完成的任務 272
5.4.1 通用混淆器 273
5.4.2 混淆最簡單的程式 276
5.4.3 對混淆所有程式的不可能性的證明 277
5.4.4 小結 278
5.5 可被證明為安全的混淆:這玩兒還能成嗎 279
5.5.1 跳出不可能性的陰霾 280
5.5.2 重新審視定義:構造互動式的混淆方法 281
5.5.3 重新審視定義:如果混淆不保留語義又當如何 283
5.6 小結 286
第6章 動態混淆 288
6.1 定義 290
6.2 代碼遷徙 292
6.2.1 算法obfkmnm:替換指令 293
6.2.2 算法obfagswap:自修改狀態機 296
6.2.3 算法obfmamdsb:動態代碼合併 307
6.3 加密技術 311
6.3.1 算法obfcksp:把代碼作為產生密鑰的源泉 312
6.3.2 算法obfagcrypt:結合自修改代碼和加密 318
6.4 小結 324
第7章 軟體防篡改 325
7.1 定義 327
7.1.1 對篡改的監測 328
7.1.2 對篡改的回響 331
7.1.3 系統設計 332
7.2 自監測 333
7.2.1 算法TPCA:防護代碼之網 335
7.2.2 生成hash函式 338
7.2.3 算法tphmst:隱藏hash值 342
7.2.4 skype中使用的軟體保護技術 349
7.2.5 算法rewos:攻擊自Hash算法 352
7.2.6 講評 356
7.3 算法retcj:回響機制 357
7.4 狀態自檢 360
7.4.1 算法tpcvcpsj:易遭忽視的hash函式 362
7.4.2 算法tpjjv:重疊的指令 365
7.5 遠程防篡改 368
7.5.1 分散式監測和回響機制 368
7.5.2 解決方案 369
7.5.3 算法tpzg:拆分函式 369
7.5.4 算法tpslspdk:通過確保遠程機器硬體配置來防篡改 372
7.5.5 算法tpcns:對代碼進行持續的改變 375
7.6 小結 376
第8章 軟體水印 378
8.1 歷史和套用 378
8.1.1 套用 379
8.1.2 在音頻中嵌入水印 382
8.1.3 在圖片中嵌入水印 383
8.1.4 在自然語言文本中嵌入水印 384
8.2 軟體水印 387
8.3 定義 388
8.3.1 水印的可靠性 389
8.3.2 攻擊 391
8.3.3 水印與指紋 392
8.4 使用重新排序的方法嵌入水印 392
8.4.1 算法wmdm:重新排列基本塊 394
8.4.2 重新分配資源 396
8.4.3 算法wmqp:提高可靠性 397
8.5 防篡改水印 400
8.6 提高水印的抗干擾能力 403
8.7 提高隱蔽性 408
8.7.1 算法wmmimit:替換指令 409
8.7.2 算法wmvvs:在控制流圖中嵌入水印 409
8.7.3 算法wmcc:抽象解析 416
8.8 用於隱寫術的水印 421
8.9 把水印值分成幾個片段 425
8.9.1 把大水印分解成幾個小片段 426
8.9.2 相互冗餘的水印片段 427
8.9.3 使用稀疏編碼提高水印的可靠性 432
8.10 圖的編/解碼器 432
8.10.1 父指針導向樹 433
8.10.2 底數圖 433
8.10.3 排序圖 434
8.10.4 根延伸的平面三叉樹枚舉編碼 434
8.10.5 可歸約排序圖 435
8.11 講評 436
8.11.1 嵌入技術 437
8.11.2 攻擊模型 438
第9章 動態水印 439
9.1 算法wmct:利用別名 443
9.1.1 一個簡單的例子 443
9.1.2 水印識別中的問題 445
9.1.3 增加數據嵌入率 447
9.1.4 增加抵禦攻擊的抗干擾性能 452
9.1.5 增加隱蔽性 455
9.1.6 講評 458
9.2 算法wmnt:利用並發 459
9.2.1 嵌入水印的基礎構件 462
9.2.2 嵌入示例 467
9.2.3 識別 469
9.2.4 避免模式匹配攻擊 470
9.2.5 對構件進行防篡改處理 471
9.2.6 講評 473
9.3 算法wmccdkhlspaths:擴展執行路徑 474
9.3.1 水印的表示和嵌入 474
9.3.2 識別 479
9.3.3 講評 480
9.4 算法wmccdkhlsbf:防篡改的執行路徑 481
9.4.1 嵌入 481
9.4.2 識別 484
9.4.3 對跳轉函式進行防篡改加固 484
9.4.4 講評 485
9.5 小結 486
第10章 軟體相似性分析 489
10.1 套用 490
10.1.1 重複代碼篩選 490
10.1.2 軟體作者鑑別 492
10.1.3 剽竊檢測 495
10.1.4 胎記檢測 496
10.2 定義 497
10.3 基於k-gram的分析 501
10.3.1 算法ssswawinnow:有選擇地記錄k-gram hash 501
10.3.2 算法ssswamoss:軟體剽竊檢測 504
10.3.3 算法ssmckgram:java 位元組碼的k-gram“胎記” 507
10.4 基於api的分析 509
10.4.1 算法sstnmm:面向對象的“胎記” 510
10.4.2 算法sstonmm:動態函式調用“胎記” 512
10.4.3 算法sssdl:動態k-gram api“胎記” 513
10.5 基於樹的分析 514
10.6 基於圖的分析 518
10.6.1 算法sskh:基於pdg的重複代碼篩選 518
10.6.2 算法sslchy:基於pdg的剽竊檢測 521
10.6.3 算法ssmcwpp:整個程式的動態“胎記” 522
10.7 基於軟體度量的分析方法 525
10.7.1 算法sskk:基於軟體度量的重複代碼篩選 525
10.7.2 算法sslm:基於度量的軟體作者鑑別 527
10.8 小結 532
第11章 用硬體保護軟體 534
11.1 使用發行的物理設備反盜版 535
11.1.1 對發行碟片的保護 536
11.1.2 軟體狗和加密鎖 541
11.2 通過可信平台模組完成認證啟動 545
11.2.1 可信啟動 546
11.2.2 產生評估結果 548
11.2.3 tpm 550
11.2.4 盤問式驗證過程 551
11.2.5 社會可信性和隱私問題 553
11.2.6 套用和爭議 555
11.3 加密的執行檔 556
11.3.1 xom體系結構 557
11.3.2 阻止重放攻擊 560
11.3.3 修補有漏洞的地址匯流排 561
11.3.4 修補有漏洞的數據匯流排 564
11.3.5 講評 565
11.4 攻擊防篡改設備 565
11.4.1 監聽匯流排——破解微軟的xbox 566
11.4.2 猜測指令——破解達拉斯半導體公司的ds5002fp微處理器 567
11.4.3 破解智慧卡 570
11.4.4 非侵入式攻擊 573
11.4.5 主機板級的保護 574
11.5 小結 576
參考文獻 578
前言
隱蔽軟體(surreptitious software)是近十年來計算機安全研究領域新興的一個分支。在隱蔽軟體的研究過程中不僅需要借鑑計算機安全方面的技術,還會用到計算科學其他領域的大量技術,如密碼學、隱寫術、數字水印、軟體量度(software metric)、逆向工程以及編譯器最佳化等。我們使用這些技術來滿足在電腦程式中安全存儲秘密信息的需求,儘管這些需求的表現形式千差萬別、各不相同。本書中“秘密”一詞的意思比較廣,書中所介紹技術(代碼混淆、軟體水印和指紋、防篡改技術以及軟體“胎記”等)的使用目的是防止他人剽竊軟體中的智力成果。比如,軟體中使用指紋技術可以用來跟蹤軟體是否被盜版,代碼混淆技術能夠加大攻擊者逆向分析軟體的難度,而防篡改技術則可以使別人很難製作軟體的破解版,等等。
好了,現在我們來講講為什麼需要閱讀本書,誰使用隱蔽軟體以及本書將會涵蓋哪些內容。
為什麼閱讀本書
與傳統的安全研究不同,隱蔽軟體不關心如何使計算機免於計算機病毒入侵,它關心的是計算機病毒的作者是如何防止他人分析病毒的!同樣,我們也不關心軟體到底有沒有安全漏洞,我們關心的是如何隱蔽地在程式中加入一些只有在程式被篡改時才會執行的代碼。密碼學研究領域中,被加密數據的安全性依賴於加密密鑰的隱秘性,而我們現在研究的恰恰是如何隱藏密鑰。軟體工程中有大量的軟體量度技術,以確保程式結構良好,本書中將使用同樣的技術使程式複雜難讀。本書中描述的很多技術都是基於編譯器最佳化技術研究開發的算法的,但是編譯最佳化的目的是使編譯器生成個頭儘量小、運行速度儘量快的程式,而使用本書中介紹的一些技術卻會使生成的程式個頭又大,執行起來又慢。最後,傳統的數字水印和隱寫術是想辦法把要隱藏的信息藏到圖像、音頻、視頻甚至純文本檔案中,而隱蔽軟體則是把需要隱藏的信息藏到計算機代碼中。
那么,為什麼要閱讀本書呢?為什麼要了解一種不能防止計算機被病毒或者蠕蟲攻擊的安全技術?為什麼要學習一種只會讓代碼體積變大而執行速度變慢的編譯最佳化技術?為什麼要把精力花在一種違反了密碼學基本前提(即密鑰是不可能被攻擊者獲得的)的密碼學分支上呢?
回答是,傳統的計算機安全和密碼學研究成果有時並不能解決實際工作中遇到的且亟待解決的安全問題。比如,在本書中將展示如何使用軟體水印技術防止軟體盜版。軟體水印是在程式中嵌入的唯一標識(類似信用卡的卡號或者著作權聲明),通過這個標識,程式的某個副本就和你(程式的作者)或者客戶聯繫在了一起。要是你發現市場上在賣自己軟體的盜版光碟,就可以通過在盜版軟體中提取的水印追查製作這個盜版軟體的母版 當初是哪個傢伙從你這裡買走的。當給合作商提供新開發的遊戲的測試版時,你也可以在測試版中加上數字水印。要是你感覺有人泄露了你的代碼,就能(從眾多的合作商中)找出肇事者,並把他送上法庭。
又比如,在程式的新版本中加上了某個新的算法,你當然不希望競爭對手也得到這個算法,並把它加到他們的軟體中。這時,你就可以去混淆程式,使之儘可能變得複雜難懂,使競爭對手逆向分析軟體時效率很低。而如果確實懷疑某人剽竊了你的代碼,本書也會教你如何使用軟體“胎記”證實你的懷疑。
再比如,你的程式中包含有某段不能為人所知的代碼,並且你想確保沒有這段代碼程式就不能正常運行。例如,你肯定不希望黑客修改程式中的軟體使用許可驗證代碼,或者可用於解密數字著作權管理系統中mp3檔案的密鑰。第7章將討論多種防篡改技術,確保受到篡改的程式停止正常運行。
聽說你把密鑰放在執行檔里了?這主意實在太糟糕了!以往的經驗告訴我們,任何類似“不公開,即安全” 的做法最終都將以失敗告終,而且不管在程式中怎樣隱藏密鑰,最終它都逃不出一個足夠頑強的逆向分析人員的手心。當然,必須承認你的做法也還是對的。本書中介紹的所有技巧都不能保證軟體能永遠免於黑客的毒手。不必保證某個東西永遠處於保密的狀態,也不必保證程式永遠處於不可能被篡改的狀態,更不需要保證代碼永遠不會被剽竊。除非這個研究領域有什麼重大的突破,否則能指望的只是延緩對方的攻擊。我們的目標就是把攻擊者的攻擊速度減緩到足夠低,使他感到攻擊你的軟體十分痛苦或要付出過高的代價,從而放棄攻擊。也可能攻擊者很有耐心地花了很長時間攻破了你的防禦,但這時你已經從這個軟體中賺夠了錢,或者已經用上了更新版本的代碼(這時他得到的東西也就一錢不值了)。
比方說,你是一個付費頻道的運營商,用戶通過機頂盒來觀看你提供的電視節目。每個機頂盒都是帶有標籤的——在代碼的某個位置上存放了分配給每個用戶的唯一標識(ID),這樣你就可以根據用戶的繳費情況決定是允許還是拒絕某個特定用戶觀看頻道里的節目。可是現在有一個黑客團伙找到並且反彙編了這段代碼,發現了計算用戶ID的算法,並且在網上以低廉的價格把修改用戶ID的方法賣給了網民。這時你該怎么辦呢?你也許想到了使用防篡改的智慧卡,不過這玩意兒並不像看上去那么難破解,這將在第11章中講解。或者你可能想到要混淆代碼,使之更難以被分析。或者你也可以使用防篡改技術使程式一被修改就自動停止運行。更有可能,你會混合使用上述各種技巧來保護代碼。但是儘管使用了所有技術,你還必須要知道並且必須接受,你的代碼仍然可能被破解,秘密仍會泄露(在這個案例里就是機頂盒裡的用戶ID仍然會被篡改)這一事實。怎么會這樣呢?這只是因為“不公開,既安全”這個想法在根本上就存在漏洞。不過既然本書中介紹的所有技術都不能給你一個“完美並且長期的安全保證”,那么為什麼還要使用這些技術,為什麼還要買這樣一本書呢?答案很簡單,代碼能頂住黑客攻擊的時間越長,訂閱頻道的客戶就越多,同時升級機頂盒的周期也就越長,這樣你賺到的錢和省下的錢也就越多。
就這么簡單。
誰使用隱蔽軟體
很多知名的公司都對隱蔽軟體有濃厚的興趣。事實上很難真正掌握有關技術在實踐中具體被使用的程度(因為大多數公司在如何保護自己的代碼一事上絕對是守口如瓶的),但是我們還是可以根據他們專利的申請和擁有情況把他們對隱蔽軟體的感興趣程度猜個八九不離十。微軟公司擁有多個關於軟體水印[104,354]、代碼混淆[62,62,69,69,70,70,180,378]和軟體“胎記”技術的專利。Intertrust公司擁有大量與數字著作權管理技術相關的組合式專利,包括代碼混淆和代碼防篡改專利。2004年,在微軟與Intertrust之間的馬拉松式官司落下了帷幕之後,微軟向Intertrust支付了高達4.4億美元的專利使用費,才獲得了後者所有的專利使用許可。同年,微軟也開始與preemptive Solution公司開展商業合作,從而把PreEmptive Solution開發的identifier obfuscator(PreEmptive solution公司在該工具中擁有專利)加到了Visual Studio的工具集裡。而普渡大學科研成果的副產品Arxan,因其獨創的防篡改算法專利[24,305]而成功地開辦了一家公司。蘋果公司擁有一個代碼混淆方面的專利,估計是用於保護其iTune軟體的。Convera,一家從英特爾公司獨立出來的企業,則著力研究套用於數字著作權管理的代碼防篡改技術[27,268-270]。從加拿大北方電信公司中分離出來的Cloakware公司也是這個領域裡最成功的企業之一。該公司擁有他們稱為“白盒加密”的專利[67,68,182],即把加密算法和密鑰藏到程式代碼中。2007年12月,Cloakware公司被一家主營付費電視業務的荷蘭公司Irdeto以7250萬美元的價格收購。即使是相對的後來者Sun Microsystem也已經提交了一些代碼混淆領域的專利申請。
Skype的VoIP客戶端也使用了類似Arxan、英特爾及本書中將要提到的代碼混淆和防篡改技術進行了防逆向工程加固。對於Skype公司來說,保護其客戶端的完整性無疑是極其重要的,因為一旦有人成功逆向分析了其客戶端軟體,解析出Skype所使用的網路協定,黑客們就能寫出廉價的能與Skype軟體進行正常通信的程式(這樣的話,人們就沒有必要一定用Skype)。所以保持網路協定不公開則有助於Skype擁有一個龐大的用戶群,這大概也是2005年易貝公司以26億美元收購Skype的原因吧。實際上,使用隱蔽軟體技術還使Skype公司贏得了足夠多的時間,進而成為了VoIP技術的領軍企業。即使這時Skype的協定被分析出來了(這一點黑客們確實也做到了,詳見7.2.4節),黑客們也拿不出一個能夠撼動Skype市場地位的類似軟體了。
學術研究者從多種角度對隱蔽軟體技術進行了研究。一些擁有編譯器和程式語言研究背景的研究者,比如我們,會很自然地加入這一領域的研究,因為涉及代碼轉換的絕大多數算法都會涉及靜態分析的問題,而這一問題則是編譯最佳化技術的研究者再熟悉不過的了。儘管以前,密碼學研究者大多不屑於研究“不公開,即安全”的問題,但最近一些密碼學研究人員已經開始把密碼學的相關技術套用於軟體水印以及發現代碼混淆技術的局限性上了。來自多媒體水印、計算機安全和軟體工程方面的研究人員也已經發表了很多關於隱蔽軟體的文章。遺憾的是,由於沒有專門的刊物、學術會議(供研究人員相互之間進行交流),這一領域的研究進展被大大延緩了。事實上,為了使這些研究成果能被傳統的學術會議和期刊接受,研究人員在不停地努力著,現在仍在努力。目前已經發表過隱蔽軟體研究成果的學術會議有POPL(Principles of Programming Languages,程式設計原理)上的ACM專題研討會、信息隱藏研討會、IEEE的軟體工程研討會、高級密碼學會議(crypto)、ISC(Information Security Conference,信息安全大會)以及其他一些關於數字著作權管理的學術會議。隨著隱蔽軟體這一領域的研究越來越成為學術研究的主流,我們有望擁有專門針對於隱蔽軟體的期刊、專題討論會甚至是研討會,只是可惜目前為止這一切都還沒有實現。
軍方也在隱蔽軟體上花了很多精力(和納稅人的錢)。比如,Cousot公司擁有的軟體水印算法專利就歸屬於世界上第九大國防工程承包商法國Thales集團。下面是一段引自最新的(2006)美軍招標檔案中有關AT(anti-tamper)技術 研究的文字。
現在,所有的美軍項目執行部門(PEO)和項目管理方(PM)在設計和實現有關係統時,必須在系統中使用軍隊和國防部制定的AT策略。嵌入式軟體現代武器系統的核心,是被保護的最重要技術之一。AT技術能夠有效地保證這些技術不被他國(人)逆向工程分析利用。僅僅由標準編譯器編譯生成而不加AT技術防護的代碼是很容易被逆向分析的。在分析軟體時,逆向工程分析人員會綜合使用諸如調試器、反編譯器、反彙編器等很多工具,也會使用各種靜態和動態分析技巧。而使用AT技術的目的就是使逆向工程變得更為困難,進而防止美國在技術領域的優勢被他國竊取。今後還有必要向部隊的PEO和PM提供更有用、更有效並且多樣化的AT工具集……研發AT技術的目的在於提供一個能夠抗逆向工程分析的高強度殼 ,從而最大限度地遲滯敵方對被保護軟體的攻擊。這樣美國就有機會維持其在高科技領域的優勢或者減緩其武器技術泄密的速度。最終,美軍就能繼續保持其技術優勢,進而保證其軍備的絕對優勢。
這份招標檔案來自於美軍飛彈和空間程式(設計部門),專注於實時嵌入式系統的保護。我們有理由相信產生這份招標檔案的原因是,美軍擔心射向敵方的飛彈由於種種原因落地後未能爆炸,使敵方有機會接觸到嵌入在飛彈中負責引導飛彈飛臨目標上空的控制軟體。
下面是另一段引自美國國防部的文字。
進行主動式軟體保護 (SPI)是國防部的職責之一,它必須開發和部署相關的保護技術,以保證含有國防武器系統關鍵信息的電腦程式的安全。SPI提供的是一種全新的安全防護方法,它並不(像傳統的安全技術那樣)保護計算機或者網路的安全,而只是加強電腦程式自身的安全。這種新方法能顯著提升國防部的信息安全情況。SPI的適用範圍很廣,從台式機到超級計算機上面所有的程式都能使用SPI技術予以保護。它是(軟體保護技術中)完整的一層,是“縱深防禦”的一個範例。SPI技術是對網路防火牆、物理安全等傳統安全技術的一個補充,但是其實現並不依賴於這些傳統的安全設備。現在SPI技術被部署在選定的HPC中心和150多家國防部機關以及其他由商業公司參與建設和維護的軍事基地。廣泛地部署SPI技術將會有效地增強美國和美國國防部對關鍵套用技術的保護。
.上面這段話說明了什麼?它說明美國國防部不僅關心飛彈會不會掉到敵方領土上去,還關心在自己的安全係數和性能都很高的計算機中心運行的軟體的安全。事實上,竊密和反竊密是防間諜機關和情報部門之間永恆的主題。比方說,一架戰鬥機上的某個程式需要更新一下,這時我們很可能就是用一台筆記本電腦連線到這架戰鬥機上進行更新操作。但是萬一這台筆記本電腦不慎遺失了,或者乾脆就被其他國家政府使用某種方法控制了,就像電影裡常演的那樣,這時會有什麼情況發生呢?對方會馬上把相關的代碼拿去做逆向工程分析,並把分析的結果用於改進其戰鬥機中所使用的軟體。更有甚者,對方會悄悄地在你的軟體中加上一個特洛伊木馬,並讓飛機在特定的時間裡從天上掉下來。如果我們不能絕對保證上述這一幕100%不可能發生的話,隱蔽軟體至少可以作為安全防禦的最後一道防線(至少還能做到事後的責任追究)。例如,飛機中的軟體可以用有權訪問相關軟體的人的ID做一個指紋簽名。要是哪天,在其他國家的戰鬥機上發現了這些代碼,就可以立即對這些代碼進行逆向分析,並進一步推算出誰是泄密事件的元兇。
什麼?我聽見你說,為什麼我要對政府之間和商業巨頭之間如何保護它們各自的秘密感興趣呢?如果黑客破解了這些軟體,他們也不過是通過自己的勞動換取一些微薄的利益而已啊。話雖如此,但是這些保護技術給你 帶來的好處最終還是大於它給商業巨頭帶來的好處。理由是,對你來說,法律形式的保護措施(如專利、商標和著作權)只有當你擁有足夠的財力,能在法庭上把對方告倒的時候才會管用。換而言之,即使你認為某家大公司通過破解你的代碼,剽竊了一個極有“錢途”的主意,你也無力通過那種馬拉松式的官司在法庭上告倒微軟,除非你有足夠的經濟實力能在這種財力的比拼中熬出頭 。而在本書中討論的保護技術(比如代碼混淆和防篡改技術)則既廉價又好用,中小型企業和商業巨頭均可使用。而且如果這時你去告這家大公司的話,也可以用水印或者軟體“胎記”等技術,在法庭上當場拿出代碼被剽竊的真憑實據來。
最後不得不簡單地提一下另一類極其擅長使用隱蔽軟體的人——壞蛋們。病毒的作者已經能非常成功地利用代碼混淆的技術偽裝病毒的代碼,使之逃避防毒軟體的檢測了。值得一提的是,人們使用這些技術(如保護DVD、遊戲和有線電視)時經常被黑客破解,而黑客使用這些技術(如構建惡意軟體)時,人們卻很難抗擊。
本書內容
隱蔽軟體研究的目的是發明能夠儘可能遲滯對手(逆向工程分析)進度,同時又儘可能地減少因為使用該技術,而在程式執行時增加的計算開銷的算法。同時也需要發明一種評估技術,使我們可以說“在程式中使用了算法A之後,相對於原先的程式,黑客攻破新程式需要多花T個單位的時間,而新程式增加的性能開銷是0”,或者最低限度我們也應該可以說“相對於算法B,使用算法A保護的代碼更難被攻破”。特別要強調一下,隱蔽軟體研究尚處於嬰兒期,雖然我們在書中會把相關的保護算法和評估算法全都介紹給大家,但是這門藝術的現狀卻還並不理想(到時候你可不能太失望啊)。
在本書中,我們試圖把當前所有有關隱蔽軟體的研究成果組織起來系統化地介紹給讀者。我們力爭每章內容涵蓋一種技術,並描述這一技術的套用領域以及目前可用的算法。第1章將給出隱蔽軟體這個領域的一些基本概念;第2章用對抗性演示的模式介紹黑客逆向分析軟體時常用的工具和技巧,然後針對這些工具和技巧介紹如何防範黑客的攻擊;第3章詳細講述黑客和軟體保護方用於分析電腦程式的技術;第4章、第5章和第6章分別介紹與代碼混淆有關的算法;第7章介紹與防篡改技術相關的算法;第8章和第9章分別介紹與水印相關的算法;第10章介紹與軟體“胎記”相關的算法;第11章講述基於硬體設備的軟體保護技術。
如果你是位企業管理人員,只是對隱蔽軟體的研究現狀和這些技術怎么套用到你的項目中感興趣,那么只要閱讀第1章和第2章就夠了。如果你是位擁有編譯器設計背景的研究人員,那么建議直接跳到第3章開始閱讀。但是之後的章節還是最好順序閱讀。這是因為……呃,還是舉個例子吧,介紹水印技術的章節中會用到在代碼混淆章節中介紹的知識。當然在本書撰寫過程中,我們還是儘量使各章內容都能獨立成章的,所以(如果你擁有一些背景知識)偶爾跳過那么一兩章也未嘗不可。如果你是一位工程師,想要使用有關技術加固你的軟體,那么強烈建議你仔仔細細地閱讀第3章的所有內容,如果有條件的話,還應該再搞幾本編譯原理方面的教材惡補一下“程式靜態分析”的知識。然後你就可以隨意跳到感興趣的章節去閱讀了。如果你是名大學生,把本書作為一門課程的教材來閱讀,那么就應該一頁一頁地完整閱讀本書,期末別忘了做好複習。
希望本書能夠做到兩件事情。首先,希望能向你,親愛的讀者,證明代碼混淆、軟體水印、軟體“胎記”和防篡改等技術里有大量妙不可言的想法,值得你花點時間去學習,而且這些技術也可以用來保護軟體。其次,希望本書能把本領域內當前所有有用的信息匯集在一起,從而為隱蔽軟體的深入研究提供一個良好的起點。
Christian Collberg和Jasvir Nagra
2009年2月2日(土撥鼠日)
P.S.實際上寫作這本書還有第三個目的。要是在閱讀本書時,你突然靈光閃現,冒出一個絕妙的主意,進而激發了你投身於隱蔽軟體研究的雄心壯志,那么,親愛的讀者,我這第三個目的就算是達到了。請把你的新算法告訴我們,我們將把它加到本書的下一版里!
作者簡介
作者:(美國)科爾伯格(Collberg C.),(美國)納蓋雷(Nagra J.) 譯者:崔孝晨
科爾伯格,瑞典隆德大學計算機科學博士,亞利桑那州立大學計算機科學系副教授,從事代碼混淆、軟體水印和“胎記”方面的基礎性研究工作。他曾在紐西蘭奧克蘭大學及中國科學院工作過。
納蓋雷,專注於設計強壯的動態水印算法,曾致力於通過代碼混淆和防篡改技術保護運行在遠程不可信平台上的軟體的完整性。目前,他任職於谷歌公司,在加利福尼亞州從事與基於程式語言的安全性有關的研究工作。
名人推薦
“本書透徹、嚴謹地介紹了計算機安全中一個日益重要的領域,是從事軟體保護的研究、學習和實踐的‘必備手冊’。”
——Mikhail Atallah,普度大學計算機科學系教授