基本內容
組中值是上下限之間的中點數值,以代表各組標誌值的一般水平。組中值並不是各組標誌值的
平均數,各組標誌數的平均數在
統計分組後很難計算出來,就常以組中值近似代替。組中值僅存在於組距式分組數列中,
單項式分組中不存在組中值。
組距數列是按
變數的一段區間來分組的,分布在各組的實際變數值已被變數值變動的範圍所取代,因此,在
統計分析時,往往用組中值來反映各組實際變數值的一般水平,即用各組變數值平均水平的數值來代表。
其假定條件是:只有當變數值在各組內成均勻分布或在組距中點值兩側呈對稱分布時,組中值代表組內變數值的一般水平才具有較高代表性。
在進行組距式分組時,組距兩端的數值稱為
組限。其中,每組的起點值稱為下限。連續型變數中,上一組的上限同時也是下一組的下限。在分組時,凡遇到單位的標誌值剛好等於相鄰兩組上下限數值時,一般把此值歸併到作為下限的那一組。
例如,可以根據人口成長的生理和心理特點將人群分為嬰幼兒組(0-6歲)、少年組(7-17歲)、中青年組(18-59)歲、老年組(60歲以上)等。組距分組掩蓋了各組內間的數據分布狀況,為反映各組數據的一般水平,我們通常用組中值來作為該組數據的一個代表值(class midpoint)。上限與下限之間的中點數值稱為組中值,它是各組上下限數值的簡單平均,即組中值=(下限+上限)/2。
若遇到開口組,則上開口組組中值=下限+鄰組組距/2; 下開口組組中值=上限-鄰組組距/2
使用組中值代表一組數據時有一個必要的假定條件,即各組數據在本組內呈現均勻分布或在組中值兩側呈對稱分布。如果實際數據的分布不符合這一假定,用組中值作為一組數據的代表就會有一定的誤差。