定義
可以說增加數據的獨立性和減少數據冗餘是企業範圍信息資源管理和大規模信息系統獲得成功的前提條件。
冗餘數據的管理所謂的數據冗餘是指資料庫的數據中有重複信息的存在,這自然浪費了很多的存儲空間,尤其是存儲海量數據的時候。
數據冗餘是指同一數據被反覆存放.這樣著某一屬性值發生改變其他與之相同的屬性值也要改變.數據冗餘不僅增加了更新代價更嚴重的是其潛在的數據不一致及存貯空間浪費等問題。
在資料庫中存貯這類導出數據項需占用較多的存貯空間亦稱為數據冗餘.存貯冗餘數據不僅代價高也是產生數據不一致的根源。
數據冗餘的作用就是將額外的數據或數據信息保存在一個獨立的硬碟上,來防止數據丟失。
目的
數據的套用中為了某種目的採取數據冗餘方式.
1.重複存儲或傳輸數據以防止數據的丟失.
2.對數據進行冗餘性的編碼來防止數據的丟失.錯誤.並提供對錯誤數據進行反變換得到原始數據的功能.
3.為簡化流程所造成額數據冗餘.例如向多個目的傳送同樣的信息.在多個地點存放同樣的信息.而不對數據進行分析而減少工作量.
4.為加快處理過程而將同一數據在不同地點存放.例如並行處理同一信息的不同內容.或用不同方法處理同一信息等.
5.為方便處理而是同一信息在不同地點有不同的表現形式.例如一本書的不同語言的版本.
6.大量數據的索引.一般在資料庫中經常使用.其目的類似第4點.
7.方法類的信息冗餘:比如每個司機都要記住同一城市的基本交通信息,大量個人電腦都安裝類似的作業系統或軟體.
8.為了完備性而配備的冗餘數據.例如字典里的字很多.但我們只查詢其中很少的一些字.軟體功能很多.但我們只使用其中一部分.
9.規則性的冗餘.根據法律.制度.規則等約束進行的.例如契約中大量的模式化的內容.
10.為達到其他目的所進行的冗餘.例如重複信息以達到被重視等等.
數據冗餘或者信息冗餘是生產.生活所必然存在的行為.沒有好與不好的總體傾向.
而對於自然界.則是物質存在的一種形式.是客觀存在情況.例如每個人都有與其他人基本相同的基因.