概念
秩統計量(rank statistic)是用於統計檢驗的一種統計量。是基於樣本值的大小在全體樣本中所占位次(秩)的統計量。設X,X,…,X為樣本,X,X,…,X為該樣本的順序統計量。若X,X,…,X互不相等,則存在惟一的R,使X=X,稱R為X之秩。記R=(R,R,…,R),稱R或R的任一已知函式為秩統計量,使用秩統計量的統計方法為秩統計方法,或簡稱秩方法。特別重要的一類秩統計量是線性秩統計量,即形如:
的統計量。其中C,C,…,C為已知常數,而a(·)為定義在{1,2,…,n}上的已知函式。
秩方法主要用於統計檢驗,稱為秩檢驗。秩方法最主要的優點是由秩方法構造的檢驗統計量在原假設下往往是分布無關的。
秩方法始自斯皮爾曼(C.Spearman)於1904年使用秩統計量檢驗兩變數是否相關的工作,而威爾柯克松(F.Wilcoxon)於1945年關於秩和檢驗的工作,則是對秩方法發展史上的一個重要貢獻。
統計檢驗
統計檢驗又稱“假設檢驗”。指利用樣本資料對總體的分布類型、數量特徵等作出判斷的一種數理統計方法。在輿論研究中,常有兩種情況需要加以檢定:第一種情況是,當對某一研究總體的特徵已有初步的了解,在此基礎上可提出一種假設,然後用抽樣方法對這一假設進行檢定。例如,根據以往的調查資料,假設某地區家庭的平均人口數為4人,為了驗證這一假設是否可信,就要從該地區抽取樣本進行分析研究。顯然,抽樣調查的結論與事先提出的統計假設之間總會存在一定程度的差異。這種差異若是由於抽樣誤差造成的,就需肯定原假設,若是由於對總體提出的統計假設有錯誤,就需否定原假設。第二種情況是,當抽取了兩個樣本,它們的統計量(如平均數、比率、標準差等)也會存在著差異。這時,這種差異是由於各自從中抽取的總體之間存在差異造成的,還是總體之間並不存在差異,甚至兩個樣本都是從同一總體中抽取的,兩個樣本統計的差異完全是抽樣誤差造成的,這就需要通過統計檢驗來加以判定。統計檢驗是以小機率原理為基礎的,所謂小機率原理可以歸納為兩個方面,一是可以認為小機率事件在一次觀察中是不可能出現的。二是如果在一次觀察中出現了小機率事件,那么就否定原有事件具有小機率的說法(即假設)。統計檢驗的一般步驟為:(一)根據所要研究的問題,提出原假設(研究假設);(二)規定一個適當的顯著性水平a,如a=0.05;(三)確定檢驗用的統計量;(四)根據顯著性水平求出假設檢驗用的統計量的臨界值;(五)用樣本資料與臨界值比較;(六)對原假設作出判斷,如果樣本統計量大於臨界值,就拒絕原假設,反之則接受。
統計量
亦稱“估計量”,抽樣總體(即樣本)計算的統計指標,也就是抽樣指標或樣本指標。如樣本的平均數、眾數、中位數、標準差、相關係數等,都是樣本統計量。根據這些統計量可以推斷總體分布或有關特徵數(即總體參數)的可靠性。由於樣本是根據隨機原則從總體中抽取的,因而樣本統計量本身也是一個隨機變數,在同一總體的不同樣本中,其各自的統計量各有不同,它是隨著樣本的變化而變化的。
人物簡介
斯皮爾曼
英國心理學家和統計學家,以智力二因素論而著稱於世。生於倫敦。1897年入德國萊比錫大學跟W.馮特學習。後曾兩次從軍。1904年曾在《美國心理學報》上發表一篇題為《客觀決定的和測定的普遍智力》的論文,被E.L.桑代克稱譽為“心理學史上的一個偉大標界”。1906年獲萊比錫大學的博士學位。1907年到符茲堡大學,拜O.屈爾佩為師,再到哥廷根大學就學於G.E.繆勒。同年回國後,被W.麥獨孤推薦為倫敦大學心理學主講。1911年升任為心理學、邏輯學教授。1924年當選為英國皇家學會院士。1928年正式被任命為心理學教授。1931年退職後為名譽教授。
斯爾皮曼是運用統計學原理編制智力測驗最早的學者之一。特別是盛行於30年代的因素分析法,最初的構想也是由他開始的,被稱為因素分析之父。他在對心理測驗材料進行統計分析的基礎上,於1904年首創智力二因素理論。他在研究中發現,不同心理能力間往往具有很高的相關,因此,他斷言,在各種不同心智活動中有一種共同的因素,他稱之為g因素。並認為任何心智活動只包括兩種因素,除g因素外,還有一種特殊因素,他稱之為s因素。他認為:g因素代表個人的普通能力,是一切心智活動的主體和智力的基礎,個體間智力的差異就取決於g因素的多寡,g因素對於任何測驗來說都是相同的;s因素代表個人的特殊能力,只有在某種特殊情況下(如特殊的工作或活動)才會表現出來,s因素因測驗而異。因此認為代表個人智力的,實際上只有g因素,智力測驗內容只應包括測量g因素的題目。由此,把斯皮爾曼的智力二因素論稱為智力單因素或普通因素論似乎更貼切。所有採用單一IQ分數的智力測驗都是以斯皮爾曼的智力理論單理論而編制的。斯皮爾曼後來在研究中發現,有些活動或測驗間具有很高的相關,這不能完全由g因素來解釋,於是他意識到除g因素和s因素外,還可能有另一中間等級的因素,如算術能力、機械能力、語言能力等。這其實就是L.L.瑟斯頓提出的群因素。
斯皮爾曼還創立了等級相關法以及反映測驗信度與測驗長度關係的公式,該公式被稱為斯皮爾曼—布朗公布。斯皮爾曼的主要著作有:《智力的性質和認識的原理》(1923)、《人的能力》(1927)、《創造的心》(1931)、《歷史心理學史》(1937)等。
威爾柯克松
美國統計學家。生於愛爾蘭的科克,卒於美國佛羅里達的塔拉哈西。1917年獲賓夕法尼亞軍事學院學士學位,1921年獲密西根大學化學碩士學位,1924年獲康奈爾大學物理化學博士學位。1925—1941年在博伊斯·湯普遜研究所從事植物和殺蟲劑等研究;1941—1943年在拉文納軍械設備控制實驗室工作;1943—1957年任職於美國氨腈公司,1957年退休。1957—1960年任職於斯坦福研究實驗室。1960年到佛羅里達州立大學從事研究與教學工作,直至去世。
威爾科克遜在統計學方面的主要貢獻是:統計、秩檢驗、多重比較、序列秩、析因設計和生物測定法等。1945年,他引入了他的雙序測試。此工作曾導致了非參數統計,激勵了非參數方法的廣泛發展。這種統計方法的引入極大地影響了套用統計學在社會科學領域的套用。他是非參數序列方法的開創者,並領導發展了不少序列秩方法.1964年,在他與他人合作出版的《某些快速近似統計法》小冊子中,闡述了多重比較法的性質等,為廣泛傳布非參數多重比較法起了重要作用。他還與他人合作導出了分數析因設計。另外,他在化學的殺真菌劑反映、植物生長、殺蟲劑研究等方面也有成就。他是戈登化學與化工統計研究會議的領袖人物,並曾任其主席。