資料庫主鍵
主鍵:表中經常有一個列或多列的組合,其值能唯一地標識表中的每一行。這樣的一列或多列稱為表的主鍵,通過它可強制表的實體完整性。當創建或更改表時可通過定義 PRIMARY KEY 約束來創建主鍵。一個表只能有一個 PRIMARY KEY 約束,而且 PRIMARY KEY 約束中的列不能接受空值。由於 PRIMARY KEY 約束確保唯一數據,所以經常用來定義標識列。
作用:
1)保證實體的完整性;
2)加快資料庫的操作速度
3) 在表中添加新記錄時,DBMS會自動檢查新記錄的主鍵值,不允許該值與其他記錄的主鍵值重複。
4) DBMS自動按主鍵值的順序顯示錶中的記錄。如果沒有定義主鍵,則按輸入記錄的順序顯示錶中的記錄。
主鍵的特性
主鍵的必要性
在有些資料庫中,雖然主鍵不是必需的,但最好為每個表都設定一個主鍵,不管是單主鍵還是複合主鍵。它存在代表著表結構的完整性,表的記錄必須得有唯一區分的欄位,主鍵主要是用於其他表的外鍵關聯,以及本記錄的修改與刪除。
主鍵的無意義性
在開發過程中,讀者可能會看到將一些表使用有意義的欄位表示主鍵,例如“用戶登錄信息表”將“登錄名”(英文名)作為主鍵,“訂單表”中將“訂單編號”作為主鍵,如此設計主鍵一般都是沒什麼問題,因為將這些主鍵基本不具有“意義更改”的可能性。但是,也有一些例外的情況,例如“訂單表”需要支持需求“訂單可以作廢,並重新生成訂單,而且訂單號要保持原訂單號一致”,那將“訂單編號”作為主鍵就滿足不了要求了。因此讀者在使用具有實際意義的欄位作為主鍵時,需要考慮是否存在這種可能性。
主鍵的選擇
①編號作主鍵
此方法就是採用實際業務中的唯一欄位的“編號”作為主鍵設計,這在小型的項目中是推薦這樣做的,因為這可以使項目比較簡單化,但在使用中卻可能帶來一些麻煩,比如要進行“編號修改”時,可能要涉及到很多相關聯的其他表,就像黎叔說的“後果很嚴重”;還有就是上面提到的“業務要求允許編號重複時”,我們再那么先知,都無法知道業務將會修改成什麼?
②自動編號主鍵
這種方法也是很多朋友在使用的,就是新建一個ID欄位,自動增長,非常方便也滿足主鍵的原則,優點是:資料庫自動編號,速度快,而且是增量增長,聚集型主鍵按順序存放,對於檢索非常有利;數字型的,占用空間小,易排序,在程式中傳遞也方便;如果通過非系統增加記錄(比如手動錄入,或是用其他工具直接在表里插入新記錄,或老系統數據導入)時,非常方便,不用擔心主鍵重複問題。
缺點:其實缺點也就是來自其優點,就是因為自動增長,在手動要插入指定ID的記錄時會顯得麻煩,尤其是當系統與其他系統集成時,需要數據導入時,很難保證原系統的ID不發生主鍵衝突(前提是老系統也是數字型的);如果其他系統主鍵不是數字型那就麻煩更大了,會導致修改主鍵數據類型了,這也會導致其他相關表的修改,後果同樣很嚴重;就算其他系統也是數字型的,在導入時,為了區分新老數據,可能想在老數據主鍵前統一加一個“o”(old)來表示這是老數據,那么自動增長的數字型又面臨一個挑戰。
③Max加一
由於自動編號存在那些問題,所以有些朋友就採用自己生成,同樣是數字型的,只是把自動增長去掉了,採用在Insert時,讀取Max值後加一,這種方法可以避免自動編號的問題,但也存在一個效率問題,如果記錄非常大的話,那么Max()也會影響效率的;更嚴重的是並發性問題,如果同時有兩人讀到相同的Max後,加一後插入的ID值會重複,這已經是有經驗教訓的了。
④自製加一
考慮Max加一的效率後,有人採用自製加一,也就是建一個特別的表,欄位為:表名,當前序列值。這樣在往表中插入值時,先從此表中找到相應表的最大值後加一,進行插入,有人可能發現,也可能會存在並發處理,這個並發處理,我們可以採用lock執行緒的方式來避免,在生成此值的時,先Lock,取到值以後,再unLock出來,這樣不會有兩人同時生成了。這比Max加一的速度要快多了。但同樣存在一個問題:在與其他系統集成時,脫離了系統中的生成方法後,很麻煩保證自製表中的最大值與導入後的保持一致,而且數字型都存在上面講到的“o”老數據的導入問題。因此在“自製加一”中可以把主鍵設為字元型的。字元型的自製加一我倒是蠻推薦的,應該字元型主鍵可以應付很多我們意想不到的情況。
⑤GUID主鍵
目前一個比較好的主鍵是採用GUID,當然我是推薦主鍵還是字元型的,但值由GUID生成,GUID是可以自動生成,也可以程式生成,而且鍵值不可能重複,可以解決系統集成問題,幾個系統的GUID值導到一起時,也不會發生重複,就算有“o”老數據也可以區分,而且效率很高,在.NET里可以直接使用System.Guid.NewGuid()進行生成,在SQL里也可以使用NewID()生成。優點是:
同IDENTITY 列相比,uniqueidentifier 列可以通過NewID() 函式提前得知新增加的行ID,為應用程式的後續處理提供了很大方便。
便於資料庫移植,其它資料庫中並不一定具有IDENTITY 列,而Guid 列可以作為字元型列轉換到其它資料庫中,同時將應用程式中產生的GUID 值存入資料庫,它不會對原有數據帶來影響。
便於資料庫初始化,如果應用程式要載入一些初始數據,IDENTITY 列的處理方式就比較麻煩,而uniqueidentifier 列則無需任何處理,直接用T-SQL 載入即可。
便於對某些對象或常量進行永久標識,如類的ClassID,對象的實例標識,UDDI 中的聯繫人、服務接口、tModel標識定義等。
缺點是:
GUID 值較長,不容易記憶和輸入,而且這個值是隨機、無順序的
GUID 的值有16 個位元組,與其它那些諸如4 位元組的整數相比要相對大一些。這意味著如果在資料庫中使用uniqueidentifier 鍵,可能會帶來兩方面的消極影響:存儲空間增大;索引時間較慢。