數據審核

數據審核

數據審核是指是指在進行數據整理之前對原始數據的審查和核對。對於通過調查取得的原始數據,主要從完整性和準確性兩個方面去審核。

基本信息

基本概念

通過各種渠道將統計數據蒐集上來之後,首先應對這些數據進行加工整理,使之系統化、條理化,以符合分析的需要。數據整理通常包括數據的預處理、分類或分組、匯總等幾個方面的內容,它是統計分析之前的必要步驟。 數據的預處理是數據分組整理的先前步驟,內容包括數據審核與數據篩選、數據排序等。

在對統計數據進行整理時,首先需要進行數據審核,以保證數據的質量,為進一步整理與分析打下基礎。從不同渠道取得的統計數據,在審核的內容與方法上都有所不同。

對審核過程中發現的錯誤,應儘可能予以糾正,在調查結束後,當對數據中發現的錯誤不能予以糾正,或者有些數據不符合調查的要求而又無法彌補時,就需要對數據進行篩選。

數據排序是按一定順序將數據排列,以便於研究者通過瀏覽數據發現一些明顯的特徵趨勢或解決問題的線索,除此之外,排序還有助於對數據檢查糾錯,以及為重新歸類分組等提供依據。在某些場合,排序本身就是分析的目的之一。

主要內容

1.準確性審核:主要是從數據的真實性與精確性角度檢查資料,其審核的重點是檢查調查過程中所發生的誤差。

2.適用性審核:主要是根據數據的用途,檢查數據解釋說明問題的程度。具體包括數據與調查主題、與目標總體的界定、與調查項目的解釋等是否匹配。

3.及時性審核:主要是檢查數據是否按照規定時間報送,如未按規定時間報送,就需要檢查未及時報送的原因。

4.一致性審核:主要是檢查數據在不同地區或國家、在不同的時間段是否具有可比性。

分類

原始數據審核

對於通過直接調查取得的原始數據應主要從完整性和準確性兩個方面去審核。完整性審核主要是檢查應調查的單位或個體是否有遺漏,所有的調查項目或指標是否填寫齊全等。準確性審核主要包括兩個方面,一是檢查數據資料是否真實地反映了客觀實際情況,內容是否符合實際;二是檢查數據是否有錯誤,計算是否正確等。審核數據準確性的方法主要有邏輯檢查 數據的審核和計算檢查 。

二手數據審核

對於通過其他渠道取得的二手數據,除了對其完整性和準確性進行審核外,還應著重審核數據的適用性和時效性。第二手數據可以來自多種渠道,有些數據可能是為特定目的通過專門調查取得的,或者是已經按照特定目的的需要做了加工整理,對於使用者來說,首先應弄清楚數據的來源、數據的口徑以及有關的背景資料,以便確定這些數據是否符合自己分析研究的需要,是否需要重新加工整理等,不能盲目生搬硬套。此外還要對數據的時效性進行審核,對於有些時效性較強的問題,如果所取得的數據過於滯後,可能失去了研究的意義,一般來說,我們應儘可能使用最新的統計數據。數據在經過審核後,確認適合於實際需要,才有必要做進一步的加工整理。

意義

現實世界中數據大體上都是不完整,不一致的髒數據,無法直接進行數據挖掘,或挖掘結果不盡如人意。為了提高數據挖掘的質量產生了數據預處理技術。這些數據處理技術在數據挖掘之前使用,大大提高了數據挖掘模式的質量,降低實際挖掘所需要的時間。

另一方面,根據科學設計所得到的數據,在使用前必須進行統計學分析才有意義。不經統計學處理的數據,沒有實際意義。沒有統計學處理的結果,只能說明觀察範圍內的結果,是一個小的樣本,這樣很難避免在抽樣中存在的誤差。因此對科學設計所得到的數據進行統計數據預處理,是進行科學統計分析的必要前提。

相關詞條

熱門詞條

聯絡我們