定義
教育統計學是運用數理統計的原理和方法研究教育問題的一門套用科學。是運用統計學的一般原理和方法研究教育科學領域數量關係的一門科學。它的主要任務是研究如何蒐集、整理、分析由教育調查和教育實驗等途徑所獲得的數字資料,並以此為依據,進行科學推斷,從而揭示蘊含在教育現象中的客觀規律。但是從研究內容來說,教育調查和教育實驗課題的提出,內容的界定,對象範圍的確定,假設的建立,結論的得出以及分析,卻不是教育統計學的研究任務,因為這些問題還要依靠與研究內容有關的教育專業知識來解決。
分類
教育統計學分類 分為兩大類:
①描述統計學,其任務是研究簡縮數據和描述這些數據。如將蒐集所得的大量數據歸類並用表格或圖形表示出來。通過計算所得的數據的“集中量數”、 “差異量數”和 “相關係數”等特徵數值,描述有關事物的典型性、波動範圍和相互關係,揭示事物的內在規律。
②推斷統計學,即利用數據進行統計檢驗、統計分析和非參數統計法作出決策。亦即以一定的置信度,根據部分數據去推斷更一般的情況,務使所得的結論能套用於更廣泛的範圍或根據已知數據結合教育特點進行預測。
產生、發展與現狀
教育統計學的產生與發展和其它學科一樣,都是社會歷史發展的客觀需要。
十九世紀中葉,因數學及其他學科發展的需要,各門學科紛紛尋求科學的方法。統計方法開始被採用,並獲得了較好的效果,如生物學、遺傳學、農業科學中的一些發現,就是在統計方法的協助下得出的。同時,這些學科的研究又對統計方法的發展做出了貢獻,數理統計就是這樣為解決科學研究中提出的各種問題而發展起來的。數理統計的發展又促進了各個學科領域中研究的進步,心理與教育統計就是在這種形勢下產生和發展起來了。
十九世紀末,一些心理學家、數學家開始把數理統計方法引用到心理與教育的研究中。
最初將統計學套用到心理與教育領域的是英國的人類學家、生物學家S.F.Galton(高爾頓)。高爾頓精於遺傳學的研究工作,並擅長於數學與其他學科,也是十九世紀對統計學理論的新發展做出較大貢獻的統計學家。他在套用統計方法研究生物學的基礎上創造了相關分析法、回歸分析法及其相關係數的計算,此外,中數、四分位數、百分位數、百分位差等也是由他發明的。在研究遺傳學時,他以統計方法作為工具,研究人類智力、體力的遺傳問題。具體來說,是採用統計的方法研究智力測驗,並且把對人類個體進行測驗時所蒐集的數據進行了統計處理。高爾頓被看成是科學心理學的創始人之一,由此也成為一名著名的心理學家。高爾頓的學生K·Pearson(皮爾遜)與其導師一樣,不僅在統計學理論上做出了突出的貢獻(如建立了以常態分配為基礎的大樣本理論,研究從樣本中導出統計結論時的抽樣誤差問題,提出了檢驗法,並將相關和回歸的理論擴展到很多領域),而且努力將他在統計上的發展套用到心理學與教育學中。
20世紀初,統計學傳入美國,桑代克(E·L·Thordike)為了達到“極力以心理學與統計學為工具而研究教育學,使教育科學化”的目的,於1904年撰寫了社會統計學套用手冊《心理與社會測量導論》,這是世界上第一本有關教育與心理統計學的專著。隨後,美國的一些大學先後開設了心理與教育統計學的課程,並出版了專著、教材。如瑟斯頓(L·L·Thurstone)的《統計學綱要》(TheFundamentalofStatistics,1924),加勒特(H·E·Garrett)的《心理與教育統計法》(StatisticsinPsychologyandEducation,1926)等。我國當時在大學的教育系和中等師範學校把教育與心理統計作為必修課程,許多從事這門課程講授的學者紛紛撰寫專著、教材,如有薛鴻志的《教育統計學》(1925),周調陽的《教育統計學》(1925),朱君毅的《教育統計學》(1930),艾偉的《高級統計學》(1933),王書林的《教育測量與統計》(1935)等,其內容大都屬於描述性統計。
四十年代以後,歐美各國比較普遍地套用數據統計的方法研究心理與教育問題。心理與教育統計學進入了以推斷統計為主要內容的新階段。這時的心理與教育統計學教材增加了小樣本理論、統計估計、統計檢驗等內容。因瑟斯頓(Thurston)等人在斯皮爾曼(Spearman)的影響下,用因素分析法研究人的心理(如智力)問題,使教育與心理統計學進入了以推斷統計為主要內容的階段。當時的主要代表著作有林金斯(E.F.Lindquist)的《教育研究中的統計分析》(StatisticalAnalysisinEducationResearch,1940)。隨後,統計學家發現統計假設檢驗所涉及的假定問題,例如總體的基本分布形態為常態分配密度不能滿足或者根本不知道分布形態,於是又引入了一種與密度的形式無關的統計方法——非參數法,使教育統計學的內容更為充實和豐富,實用範圍更加廣泛。中國當時有沈有乾的《教育統計學講話》(1946),《實驗設計與統計方法》(1947)。
40至70年代,國外教育與心理統計學的發展迅速,中國40年代,教育與心理統計學也得到了一定程度的普及與套用。50至70代,由於歷史的原因,與世界水平拉開了距離,落後了20年。
七十年代以後,由於電子計算機的迅猛發展,使以往因為計算繁雜而使套用受到限制的統計方法變得簡單易行,同時在教育與心理的理論與方法方面,不但充實了描述統計學、推斷統計學的內容和方法,而且還了發展了多元統計分析和其他現代數學在教育與心理研究和實驗中的套用。對於大量的、複雜的數據處理,已有了專門的統計軟體包(如SPSS),基本上包含了各種常用的統計方法。
如今關於心理與教育統計學的套用變得更加廣泛。中國自1979恢復聯考和教育系、心理系後,也恢復了教育統計學這門課程,
到目前為止,中國正式出版的教育、心理統計學的書籍已有二十本左右,其中影響較大的有葉佩華,陳一白等主編的《教育統計學》(1982),張厚粲等主編的《心理教育統計學》(1986,)等。
沿革
20世紀初,美國心理學家E.L.桑代克為了使教育科學化,以心理學和統計學為工具研究教育學,於1904年寫了一本社會統計學套用手冊《心理與社會測量導論》,這是世界上第一本有關教育統計學的專著。此後,美國的大學先後開設心理和統計課程,並出版教材。如:心理學家L.L.瑟斯頓的《統計學綱要》(1925)、實驗心理學家H.E.加勒特的《心理學與教育中的統計法》(1926)等。這些教材的內容大部屬於描述統計。
40年代以後,歐美各國比較普遍地套用數理統計方法研究心理與教育問題,所用教材增加了小樣本理論、統計估計、統計檢驗等主要內容。由於瑟斯頓等人在英國心理學家C.E.斯皮爾曼的影響下用因素分析法研究人的智力等,從此,教育統計學進入了以推斷統計為主要內容的階段。當時的代表著作有E.F.林奎斯特的《教育研究中的統計分析》(1940)。隨後,統計學家發現了統計假設檢驗所涉及的假定(assumption), 例如, 總體的基本分布形式為常態分配密度不能滿足或者根本不知道基本分布的形式,則引入一種與密度的形式無關的統計方法──非參數方法,使得教育統計學的內容更為充實、豐富,實用範圍更為廣泛。
這方面的代表著作有W.J.波帕姆與K.A.塞羅蒂尼克合著的《教育統計學──套用與說明》(1973),J.P.吉爾福德與B.弗魯奇特合著的《心理學與教育中的基礎統計學》 (1978)。 70年代由於電子計算機的廣泛套用,不少教育統計學的教材也介紹了電子計算機處理數據。如1973年美國D.懷特所著的《教育統計──附數據處理》就是其中的一本。
研究對象
教育統計學的研究對象是:教育問題,它是在質與量的辯證統一中著重從數量的角度去研究教育現象的發展變化,從而達到對其質的屬性和規律的認識。
內容
一、描述統計
是依據統計的方法對所蒐集的數據資料進行加工整理,通過圖示、求典型量數等手段對數據資料進行分析和描述。
調查和實驗室蒐集統計資料的主要途徑;統計表、統計圖是呈現統計資料的主要形式;統計資料的典型量數主要有反應集中趨勢的集中量數、差異量數和相關量數等。如學業考試中的平均成績、優秀率等;教育行政部門掌握的升學率等。
二、推斷統計
主要是研究由部分區說明整體的理論與方法,即根據局部的信息,利用統計的原理與方法,分析論證在一定可靠度下總體的數量特徵或分布特徵。它以描述統計為基礎。
三.多元統計分析。教育或心理的研究和實驗,常會受到多種因素的影響。而尋找主要的影響因素,把相近或相關的因素合併或歸類則是多元統計分析的主要任務。多元分析增強了心理與教育研究和實驗的可靠性與準確性,使研究更貼近客觀實際,但是多元分析的理論深奧,計算複雜,直到計算機技術的發展與普及的今天,有了專門成熟的軟體包,才使得多元統計分析法獲得廣泛的套用。多元統計分析的主要內容有主成分分析、因素分析、聚類分析、多元方差分析、多元回歸分析等等。
4.模糊統計學。教育、心理現象的不確定性,不僅表現為隨機性,而且更多地表現為模糊性。因此,對心理與教育現象進行模糊性的描述也是必然的,不可缺少的。
與教育測量學密切聯繫
①教育統計學所加工的原料來自教育測量所提供的數據,而數據真實情況與可靠程度決定於教育測量本身的效度(validity)和信度 (reliability),關於效度和信度的確定以及教育測量中的項目分析 (item analysis),又必須運用統計學中的相關係數和因素分析。②教育測量學中各種量表的編制及各種常模(norm)的確定,必須運用統計學知識,如百分位數、平均數、標準差、標準分數、常態分配等。
實驗統計學(experimental statistics) 的興起,使得統計學的內容大為充實。其影響所及,也使教育統計學的範圍有所擴展。這表現在:①教育研究中所使用的數據是多樣性的,就變數“水平”分,不僅有等距的(interval)和比率的 (ratio),而且不少是屬於稱名的(nominal)、順序的(ordinal),各種不同“水平”的變數,各有其相應的統計方法, 如對於後兩種變數, 不得使用平均數和標準差進行統計分析。②教育問題中,往往出現樣本容量大, 因而可能利用大數法則(law of large numbers)以近似的途徑作替代的統計分析。
中國的教育統計學是在辛亥革命以後,隨著西方科學技術成就一起被引入的。當時的大學教育系和中等師範學校都把教育統計學作為必修課程。有不少學者講授這門課程,並撰寫了專著。如薛鴻志著《教育統計法》(1925)、朱君毅著 《教育統計學》 (1930)、沈有乾著《教育統計學講話》(1946)、《實驗設計與統計方法》(1947)等。50年代以後,由於精簡課程,學校中的教育統計學停開,1979年以來,隨著教育科學研究的發展,教育統計學又得以恢復。教育部組織葉佩華(主編)、萬梅亭、郝德元、陳一白等編寫了《教育統計學》(1983)作為全國通用教材。
發展趨勢
近年來,由於電子計算機的使用,使得統計學領域出現了不少的革新措施。這些措施對教育統計學產生著影響。
①為了節省時間,簡化程式,現行的教育統計學教材,都列有各種統計量的定義公式和計算公式。為了提高效率,使用電子計算機時,為電子計算機所接受的計算公式受到越來越多的重視和運用。②過去教育統計學教材中大都用相當多的篇幅專門介紹分組頻數分配的所謂簡捷的統計處理法。這樣做雖然有一定的描述作用,但與電子計算機相比,計算手續不簡捷,結果也不準確。而電子計算機直接處理數據,不但比較迅速準確,還可直接編制頻數分配表,不必對全部數據經過逐一划記的手工操作。因此現在已有不少教材,只介紹次數分配表、相關表或相關散布圖的編制。而對於如何利用次數分配表、相關表為基礎,作進一步的統計處理,則未多作說明。
③過去的教育統計學教材對於回歸分析這一內容的論述,由於計算繁瑣,往往只介紹一元、二元回歸,對於三元以上的回歸問題最多只作一些理論上的介紹,對於實際運用,就很少詳談。這對於“要根據多種有關變項所造成的效果”的教育問題進行預測顯然是不夠的。隨著電子計算機在教育統計學中的推廣使用,多元統計分析將日益受到重視和運用。
總之,由於電子計算機的套用和實驗統計學的發展,著重實用性的教育統計學,將對那些實用性不大的內容進行刪簡,而對許多必要的統計方法則予以引進,這將是今後教育統計學的發展趨勢。
學習要求
(一)掌握統計的辭彙
像漢語、外語有其辭彙一樣,統計也有它自己的辭彙。那么為了學好統計,也應掌握其辭彙。初學者應當把統計辭彙當中一門外語來學。統計學的辭彙是與普通的數學共同使用著數值運算的普通符號,其中既有英文字母的縮寫,也有希臘字母。掌握這些符號的意義,對學習統計學十分重要。
(二)獲得並擴大計算的技能
統計學與其它任何技能一樣,計算的技能,包括公式的套用,設計有效的運算,都是隨著具體的實踐——計算而一同增長的。
(三)學習正確理解和解釋統計結果
統計結果,只有得到正確解釋時,才是有用的。相反,如果解釋不當,則這種統計結果會比浪費勞動力還糟糕,如果解釋是錯誤的,則這種統計結果比無用還要惡劣的多。所以,正確地解釋統計結果極為重要,對任何統計結果都必須全面考慮、慎重對待,尤其是在具體實踐中尤其如此。
(四)學會使用統計方法
雖然一切統計方法都能闡明數字資料,但是,各種統計方法在具體使用上各有它們的區別和要求。因此不同的材料需要選用相應的統計方法。
(五)掌握統計的邏輯
就像語言和辭彙一樣,統計所提供的也是一種思維方法,一種邏輯系統,需在學習過程中進行理解。