內容提要
回歸分析在科學研究領域是最常用的統計方法。《SPSS回歸分析》介紹了一些基本的統計方法,例如,相關、回歸(線性、多重、非線性)、邏輯(二項、多項)、有序回歸和生存分析(壽命表法、Kaplan-Meier法以及Cox回歸)。後面的章節介紹了另外一些回歸分析方法和模型,例如,個體生長曲線的建模、PLS 部分最小平方回歸、嶺回歸、巢式病例對照研究。
《SPSS回歸分析》對運用SPSS進行回歸分析的介紹,目的是讓讀者對於這方面的基礎知識有一個初步了解和掌握,有經驗的讀者藉此可在數據挖掘(例如,利用Clementine)領域獨立地繼續學習新知識
前言
回歸分析及其各種變型在科學和研究領域是最常用的統計方法(例如,參見著作Hsu,2005、Pötschke & Simonson,2003、Elmore & Woehlke,1998,1996和Goodwin & Goodwin,1985)。各個學科領域、科研工作以及統計學的發展既對這些統計方法不斷提出更高的要求,同時又起到巨大的推動作用(例如,參見 Rigby 等人 2004年的著作和Ripoll等人1996年的著作)。
某些作者也將回歸分析稱為最古老的統計方法之一。Stanton(2001)認為,線性回歸基本統計方法的建立起源於Karl Pearson(例如,1896年發表的論文)的論文。Howarth(2001)則認為,線性分析基本理論及其使用方法甚至要追溯到Bond在1636年發表的一篇論文(例如,參見Finney,1996)。
回歸分析發展史上的里程碑,是18世紀中葉人們創建了基本的計算方法後,從而與此相關地發明了“最小二乘”算法。直到20世紀中期發明了計算機之後,多元回歸分析方法才被越來越多地套用于海量(並且容易出錯)計算,從而加快了回歸分析方法的套用、傳播和發展。回歸分析方法發展史上的其他(任意選出的)里程碑如有20世紀70年代出現的嶺回歸、80年代興起的穩健回歸以及90年代創建的新方法或對原有方法的混合使用。但是,作為一種表面上傳統的方法,如今回歸分析在用於數據挖掘時不僅僅是與其他新型方法(如神經網路)處於同一水平(例如,SPSS,2007b,第10章、Rud,2001、Berry & Linoff,2000和Graber,2000),而且比其他方法的使用要頻繁得多(例如,Rexer等人2007年的著作和Ayres,2007)。但是,即使是套用數據挖掘的操作十分容易,數據挖掘也不能取代統計學或者計算機信息學知識,而是以這些知識為前提(Schendera,2007、Khabaza,2005、Chapman 等人,1999)。因此,本書針對如何套用SPSS回歸分析方法而介紹的基礎知識也可以使讀者對數據挖掘領域初窺門徑。
統計學的初學者可能對“回歸”方法這個大家族的強大、多樣化和靈活性感到十分吃驚。對於進階學習者而言,他們可能始終感興趣的是如何利用回歸分析方法來處理大量的、參差不齊的問題。例如,簡單和多重(非)線性回歸分析、個體生長曲線、生存分析、時間序列分析等。從另一方面來看,如此廣闊的套用範圍就面臨一個問題,即人們無法單純依靠背誦就可以掌握:“對於帶有一個定距因變數的線性因果模型,人們通常使用線性回歸;對於帶有一個二元因變數的因果模型,就使用邏輯回歸等。”或者:“對於線性回歸使用SPSS過程命令 REGRESSION、對於邏輯回歸使用SPSS過程命令 LOGISTIC或NOMREG、對於生存數據使用SURVIVAL、KM或COXREG等。”
與之相反,包括SPSS在內的統計學知識是十分複雜、靈活和多樣化的。高級套用者主要將SPSS過程命令 REGRESSION用於線性、共線性數據或者時間序列數據。例如,SPSS過程命令GLM既可以用於在一般線性模型(ALM)中對方差分析的計算,也可以利用多個因變數進行回歸分析。例如,相對比較新的SPSS過程命令GENLIN(SPSS 15版之後才有),作為一般線性模型既可以對伽瑪回歸、採用重複測量設計的二元邏輯回歸進行計算,也可以對區間截尾的生存數據的雙對數回歸進行計算。
此外,統計量的多樣性比SPSS本身的功能範圍要大得多。例如,生存數據可以分為一個預期的風險(常規的生存分析、生存分析)、多個預期的互斥風險生存分析(competing risk survival analysis)或者反覆性風險(recurrent risk survival analysis)。
因此,選擇適當的回歸分析方法不僅取決於可用的SPSS選單、SPSS過程命令或者“菜譜”,還取決於具體的內容和方法邏輯。例如,需要調查的問題(假設有很多類型,如區別與關聯相比照)。但是也取決於需要確定的定義,例如,數據的測量水平、分布、轉換、數據關聯性/無關聯性、主效應和互動效應的建模及很多其他的定義。應與有經驗的方法學專家或者統計學專家協商後,再對回歸分析方法做出選擇。對於特殊的問題,標準軟體也有可能無法實現所需的統計方法。在這種情況下,也可以自己用SPSS或者Python編程設計出一種方法(參見宏“Ridge-Regression.sps”),或者使用專門的分析軟體。進行模型設定和推斷性統計假設檢驗的操作方法通常越來越複雜(參見Schendera著作,2007,401-403)。
本書介紹了一些基本的統計方法。例如,相關、回歸(線性、多重、非線性)、邏輯(二項、多項)、有序回歸和生存分析(壽命表法、Kaplan-Meier法以及Cox回歸)。後面的章節介紹了另外一些回歸分析方法和模型(例如,個體生長曲線的建模、PLS部分最小平方回歸、嶺回歸、巢式病例對照研究)。
在這裡對SPSS進行回歸分析的介紹,目的是讓讀者對於這方面的基礎知識有一個初步了解和掌握,有經驗的讀者可在此基礎上在數據挖掘(例如,利用Clementine)領域獨立地繼續學習新知識。由於篇幅所限,本書沒有介紹很多其他的回歸形式和具體套用(例如,非參數回歸、分類回歸、Weibull回歸、 Hedonic回歸等,對此請參見本書第6章)。
本書介紹了相關分析(第1章)、回歸分析(線性、多重、非線性,第2章)、邏輯和有序回歸分析(第3章)以及生存分析(Survivalanalyse,第4章)的基本方法。對於所有的方法,詳細闡述了其前提條件和常犯的錯誤。第5章介紹了回歸分析的特殊用途(偏回歸、個體生長曲線的建模、嶺回歸)。第6章介紹了SPSS的其他用途(例如,對多個因變數的回歸分析)。
書中的大量計算實例系統地演示了所提出的問題、各個統計量的調用方法(通過滑鼠、語法)以及對SPSS輸出結果的解釋。也探討了各種錯誤和難點。關於在實施統計分析之前對數據的檢驗,可參考《SPSS的數據質量》一書(Schendera,2007)。
書中用單獨的段落歸納了實施各個分析的各種前提條件以及對其進行檢驗的方法。本書淺顯易懂,既側重具體套用,同時對各種方法的解釋又沒有忽略其複雜性和必要的深度。本書的讀者既可以是回歸分析的入門者,也可以是經濟、生物和社會科學的學生或學者。
本書既採用了選單導航,又羅列了大量SPSS語法。Windows SPSS 的初學者應從中了解到,單擊滑鼠就可以自動調用SPSS語法或者自己編程設計SPSS語法(參見Schendera,2007,2005)。針對SPSS程式設計師(也包括普通用戶),則展示了如何藉助SPSS過程命令PLS來擴展SPSS-Python。利用同名的SPSS宏介紹了嶺回歸。
第1章介紹了往常被人們低估的相關分析(SPSS過程命令 CORRELATIONS)的入門知識。本章開頭部分解釋了關聯(因果性),並列舉了幾個錯誤結論的例子,如人們常說的喜歡玩暴力型電腦遊戲和個人暴力傾向之間的關聯。如果讀者對回歸分析感興趣,則強烈建議先閱讀關於相關分析的章節。藉助於相關分析,作者闡述了首要的、對於(線性)回歸分析也適用的前提條件。例如,尺度水平、同方差性和連續性。接下來的幾段闡述了線性、產生錯覺相關和一型差誤累積幾個主題,並且解釋了為什麼只給定相關係數的數值是遠遠不夠的。本章還介紹了相關分析的其他一些特殊用途,主要是相關係數的比較和正準相關。最後一段歸納了實施相關分析的各種前提條件以及對其進行檢驗的方法。
第2章介紹了回歸分析的入門知識。本章採用逐步推進的架構,來闡明進行回歸分析的基本原則,並且幫助讀者從一開始就避免常犯的基本錯誤。
第2.1節首先介紹了簡單線性回歸分析(SPSS過程命令REGRESSION)。第2.1節是基於第1章的內容展開的。通過一個簡單的例子,闡述了如何根據槓桿值和殘差來檢驗線性和識別離群值。還闡述了如何檢驗可能存在的自相關。一般來說,利用線性回歸分析只能調查線性函式。利用線性回歸分析來調查非線性函式通常會產生錯誤的結果。
第2.2節闡述了如果數據不是線性而是曲線分布時應該怎么做。第2.2節是基於第2.1節的內容展開的。本章提供了兩種解決方案:將非線性函式進行線性化,並用線性回歸進行分析;也可以用非線性回歸對非線性函式進行估計(SPSS過程命令CNLR和NLR)。非線性回歸是本章的中心主題,包括帶有兩個預測變數的非線性回歸。此外,本節還闡述了用於(非)線性曲線擬合的SPSS過程命令CURVEFIT的意義和限制。最後幾段總結了非線性回歸的各種假設,並通過一個總覽表介紹了較為知名的一些非線性回歸模型,其中含有一個或多個預測變數。
第2.3節介紹了多元線性回歸分析(SPSS過程命令REGRESSION)的基礎知識。第2.3節是基於第2.2節的內容展開的。模型含有多個自變數,而非僅有一個自變數,這種模型主要是在於自變數相互之間的關係。本節著重探討了建模、變數選擇、多重共線性和其他難點。除了識別和消除多重共線性外,本節還探討了如何處理時間相依(自回歸)數據。最後一段歸納了實施(非)線性回歸分析的各種前提條件以及對其進行檢驗的方法(見第2.4節)。
第3章介紹了邏輯回歸和有序回歸的基本方法。本章的結構是根據因變數的尺度水平構建的。最後幾段分別歸納了所介紹方法的各種前提條件以及對其進行檢驗的方法。
二元邏輯回歸(SPSS過程命令LOGISTIC REGRESSION,第3.2節)需要使用一個二值因變數,這個方法中沒有考慮因變數中的極差信息。本節首先介紹了作為基本方法的二元邏輯回歸,然後闡述了這種方法與其他方法的共同點和區別(主要是模型和尺度水平),並根據幾個計算實例,主要闡述變數選擇的不同方法,以及對所輸出統計量的解釋。最後探討了經常出現的模型擬合優度和預測精度不一致問題。
有序回歸(SPSS過程命令PLUM,第3.3節)需要使用至少兩個取值的(定序)因變數,並且考慮到了因變數中的極差信息,同時闡述了與其他方法的共同點和區別(主要是模型、尺度水平)。最後根據幾個計算實例,闡述了如何解釋模型的SPSS輸出結果,其中這些模型帶有定距和分類預測變數。
多項邏輯回歸(SPSS過程命令NOMREG,第3.4節)同樣需要使用一個至少二級的定類因變數,這種方法沒有考慮因變數中的極差信息。對多項邏輯回歸的闡述與第3.2節類似。此外,還介紹了一種特殊情況,即帶有定量預測變數的巢式病例對照研究(1∶1)。
第4章介紹了生存分析的基本方法。原則上,生存分析調查的是到出現特定目標事件為止的時間。目標事件既可以是期望事件(例如,延長訂單、受聘、學習成功、治癒等),也可以是不良事件(例如,被解僱、故障、舊病復發、死亡等)。這些方法有各種各樣的名稱,例如,壽命分析、生存分析、時間影響或者事件分析等,它們來自於對目標事件的不同評估。根據對目標事件的評估結果不同,對於圖表應給予不同的解釋。
第4.1節首先介紹了生存分析的基本原則,然後介紹了面臨的一些典型問題和生存分析的目標。
第4.2節闡述了對不同生存函式(主要包括累積生存函式S(t)、1減去生存函式(1-S(t))、密度函式f(t)、對數生存函式l(t)以及風險函式h(t))的規定。
第4.3節介紹了數據截尾的入門知識。在進行生存分析時,在某些個案中,可能出現目標事件沒有如期望的那樣發生,也就是說,目標事件完全沒有或者沒有按期望的(設定的)原因而發生。為了將這些個案與帶有期望事件的個案隔開,就需要藉助於截尾將其標出。本節介紹了左截尾、右截尾和區間截尾,並且詮釋了在(非)試驗性調查設計時的截尾。
第4.4節以壽命表法和Kaplan-Meier法為例,闡述了如何用這些方法測算生存函式,以及在這個過程中如何處理截尾的個案。從第4.6節開始介紹SPSS示例。
第4.5節介紹了對各組進行比較的不同檢驗:對數極差檢驗(又稱時序檢驗或者Mantel-Cox檢驗)、Breslow檢驗(又稱修正的Wilcoxon檢驗、Wilcoxon 秩和檢驗)、Tarone-Ware檢驗和似然比檢驗。此外,本章還歸納了一個比較性綜述,以及對於解釋這些檢驗的建議方案。
在第4.6節中,計算和解釋了如何用SPSS的壽命表法(SPSS過程命令 SURVIVAL)和Kaplan-Meier法(SPSS過程命令KM)。本節還闡述了Cox回歸。針對壽命表法提出了帶有或者沒有因子的幾個實例。在對Kaplan-Meier法的闡述中,介紹了帶有/沒有因子、帶有分層變數並且針對測定置信區間的一些實例。
第4.7節首先介紹了Cox模型的特點(SPSS過程命令COXREG),然後將這種方法與壽命表法、Kaplan-Meier法和線性回歸相比較,計算和解釋了Cox回歸的幾種變型(時間獨立協變數、時間相依協變數、互動作用和“模式”)。接下來的幾段介紹了檢驗Cox回歸特定前提條件(主要是對截尾、多重共線性和比例性假設的分析)的方法以及如何建立對比(“偏差”、“簡單”、“Helmert”等)。最後歸納了所介紹方法的各種前提條件,以及對其進行檢驗的方法。
第5章藉助於SPSS分析示例介紹了回歸分析方法的其他用途。
第5.1節闡述了兩種形式的偏回歸。第5.1.1節介紹了部分最小平方回歸(Partial Least Squares,PLS)。尤其是在有很多預測變數、預測變數相互高度相關,並且(或者)預測變數的數量超過個案的數量時,建議使用PLS。PLS兼具主成分分析和多元回歸的特點,從而可以將任意測量水平、任意數量的(潛)變數之間的因果關係模擬成線性的結構化方程模型。此外,PLS還支持混合回歸模型和混合分類模型。自變數和因變數既可以是定距的,也可以是定類的。從SPSS 16版開始提供了PLS命令,PLS是基於Python擴展的。第5.1.2節介紹了利用SPSS過程命令REGRESSION進行相關分析的一種偏回歸形式。
第5.2節介紹了如何利用線性混合模型(SPSS過程命令MIXED)對個體生長曲線進行線性建模。個體生長建模(individual growth modeling)大致上也可以改寫為“對個體進行重複測量的方差分析”。對於“普通”線性回歸而言,只有一條回歸線(例如,回歸線也會利用輪廓圖生成重複測量的方差分析)通常不適合各個不同的個體(線性)運行曲線。但是在進行重複測量的回歸分析或者方差分析之前,利用隨機截距模型進行建模,就可以根據截距、斜率和兩個參數同時估計出個體的運行曲線。藉助於一個分為三級的實例分析,下文演示了某個培訓項目所有學員的成績在經過一段時間培訓後是否以及在多大程度上有區別。在這個實例中具體檢驗了:(a)培訓學員的(成績)水平是否波動(截距),(b)培訓學員成績提高的幅度和速度是否不同(斜率),以及(c)在考慮到培訓學員成績水平的情況下,他們成績的提高幅度是否不同(兩個參數)。
第5.3節介紹了嶺回歸(SPSS宏“Ridge-Regression.sps”)。嶺回歸可以(主要是通過目視)檢驗的是,可能具有多重共線性的數據是否可以用多元線性回歸分析來進行分析。與其他統計方法相反,SPSS嶺回歸沒有採用選單導航,而是只能採用宏的形式。但是,嶺回歸的實施並不複雜。本節主要演示了多重共線性的可視化,以及如何針對所選擇的K值計算嶺回歸。由於2008年的SPSS 16版沒有宏“Ridge-Regression.sps”,因此本節的實例主要基於SPSS 15版的宏。
第6章用一個總覽表介紹了利用SPSS進行回歸分析的其他方法(例如,多個因變數的回歸分析)。與前面的章節相反,沒有對示範性的SPSS分析進行覆核。這個總覽對完全性不做要求。作為例證,這裡歸納了示範性分析的、沒有註解的語法示例,主要是因為目前只有通過這種方式才能看到相應的要求。
為了評估SPSS的輸出結果,了解其統計定義和推導過程是必不可少的。在本書的最後一章,歸納了一些最重要的統計方法的公式。
在開始進行分析之前,請先確定你的數據足以進行分析。檢查你的數據是否有潛在的錯誤(主要是完整性、統一性、缺失值、離群值、重複值)。信任是非常好的,但是檢查更加重要。對數據質量的準則和用SPSS驗證數據質量這方面知識感興趣的讀者,請參考Schendera(2007)的著作。
在這裡要特別感謝以下各位的專業建議和(或)他們通過語法、數據和(或)資料對本書做出的貢獻:Vijay Chatterjee教授(西奈山醫學院,紐約,美國)、Mark Galliker教授(伯爾尼大學,瑞士)、Jürgen Janssen教授(漢堡大學)、Mitchel Klein教授(埃默里大學羅琳斯公共衛生學院,亞特蘭大,美國)、Roderick J.A. Little教授(密西根大學,美國)、Daniel McFadden教授(加州大學伯克利分校,美國)、Rainer Schlittgen教授(漢堡大學)、Stephen G. West教授(亞利桑那州立大學,美國)、Matthew M. Zack(疾病控制中心,喬治亞州亞特蘭大,美國)。
還要感謝德國SPSS軟體慕尼黑有限責任公司的Alexander Bohnenstengel先生、Sabine Wolfrum女士和Ingrid Abold女士慷慨地提供了這套軟體和相關的技術資料。同樣,也要感謝SPSS瑞士分公司的Josef Schmid先生和Daniel Schloeth博士。
感謝奧登伯格出版社Schechler博士對發表本書的信任以及對此提供的大力支持。Peter Bonata先生(科隆)為Cox回歸一章奠定了基礎。Volker Stehle先生(埃平根)負責本書的印刷排版工作。Stephan Lindow先生(漢堡)為本書製圖。Markus Schreiner先生(海德堡)為特殊分布提供了隨機數據。如果本書中還有闡述不清楚或者錯誤的地方,歡迎各位讀者不吝賜教。
Dr. ChristianFG Schendera(克里斯蒂安·FG·申德拉博士)
瑞士,伯爾尼
目錄
第1章 相關 1
1.1 引言 1
1.2 第一個前提條件:尺度水平 4
1.3 其他前提條件:線性、同方差性和連續性 5
1.4 說明:對線性的圖形檢驗 6
1.4.1 過程GRAPH,Scatterplot選項 6
1.4.2 SPSS過程命令 CURVEFIT 7
1.5 相關係數的統計和解釋 10
1.5.1 相關係數的統計量 11
1.5.2 相關係數的解釋 11
1.6 利用 SPSS 的計算(示例) 14
1.7 難點:線性、產生錯覺相關和一型差誤累積 16
1.7.1 產生錯覺相關和偏相關 16
1.7.2 一型差誤累積問題 19
1.8 特殊用途 20
1.8.1 相關係數的比較 21
1.8.2 比較相關的一致性 22
1.8.3 正準相關 23
1.9 計算皮爾遜相關係數的前提條件 24
第2章 線性回歸和非線性回歸 26
2.1 線性回歸:有因果方向的關聯 27
2.1.1 雙變數線性回歸:利用REGRESSION的回歸分析概述 27
2.1.2 雙變數線性回歸的示例和語句——第一步:根據槓桿值和殘差檢驗線性並識別離群值 32
2.1.3 輸出結果和解釋 37
2.1.4 過程2:刪除離群值的效應——選出的輸出結果 49
2.1.5 說明:繪製回歸直線(IGRAPH)的圖形 51
2.2 非線性簡單回歸 51
2.2.1 利用線性回歸對線性函式進行分析 53
2.2.2 利用線性回歸分析調查非線性函式 53
2.2.3 將非線性函式線性化,並利用線性回歸進行調查 54
2.2.4 利用非線性回歸分析非線性函式:非線性回歸 56
2.2.5 更高的要求:帶有兩個預測變數的非線性回歸 67
2.2.6 用於非線性回歸的SPSS過程 NLR 和 CNLR 70
2.2.7 非線性回歸的假設 73
2.2.8 總覽表:非線性回歸的模型 74
2.3 多元線性回歸:多重共線性和其他難點 76
2.3.1 多元回歸的特點 77
2.3.2 第一個例子:多元回歸特殊統計的解釋 79
2.3.3 第二個例子:多重共線性的識別和消除 93
2.4 計算線性回歸的前提條件 99
第3章 邏輯回歸和有序回歸 105
3.1 引言:因變數的因果模型和測量水平 106
3.2 二元邏輯回歸 107
3.2.1 邏輯回歸方法和與其他方法的比較 107
3.2.2 示例界面和語法:逐步法(BSTEP) 111
3.2.3 輸出結果和解釋 114
3.2.4 示例和語法:直接法ENTER 122
3.2.5 輸出結果和解釋 123
3.2.6 補充說明邏輯回歸的理論檢驗vs診斷:模型擬合優度vs預測效率 127
3.2.7 二元邏輯回歸的前提條件 127
3.3 有序回歸 133
3.3.1 有序回歸方法和與其他方法的比較 134
3.3.2 例1 界面操作和語法:定距預測變數(WITH-選項) 135
3.3.3 輸出結果和解釋 138
3.3.4 例2和語法:分類預測變數(BY選項) 143
3.3.5 輸出結果和解釋 144
3.3.6 有序回歸的前提條件 151
3.4 多項邏輯回歸 152
3.4.1 例子、界面選擇和語法:主效應模型(二元因變數) 153
3.4.2 輸出結果和解釋 159
3.4.3 補充說明:逐步計算帶有一個二元因變數的模型:NOMREG REGRESSION和LOGISTIC REGRESSION輸出結果的比較 163
3.4.4 特殊情況:帶有定量預測變數的巢式病例對照研究(1:1)——示例、
語法、輸出結果和解釋 164
3.4.5 補充說明:LOGISTIC REGRESSION 對比 NOMREG (區別) 168
3.4.6 多項邏輯回歸的前提條件 169
3.5 本章所介紹的各種回歸方法的比較 173
第4章 生存分析 175
4.1 生存分析概述 176
4.2 生存分析的基本原理 178
4.2.1 生存函式S(t) 178
4.2.2 確定生存函式S(t) 179
4.2.3 其他函式 180
4.3 截尾數據 182
4.3.1 非期望事件或者未發生目標事件 182
4.3.2 對截尾數據與非截尾數據做不同處理的三個理由 183
4.3.3 失效數據和截尾的處理(三種方法) 184
4.4 估計生存時間S(t)的方法 185
4.4.1 保險精算法和壽命表法 185
4.4.2 使用Kaplan-Meier法估計生存時間S(t) 186
4.4.3 無截尾和有截尾的示例(方法:Kaplan-Meier) 187
4.5 對多個組進行比較的檢驗 190
4.6 利用SPSS進行生存分析 192
4.6.1 示例:無因子Kaplan-Meier法 193
4.6.2 示例:採用因子的Kaplan-Meier法 198
4.6.3 利用因子變數與分層變數進行比較(Kaplan-Meier法) 202
4.6.4 Kaplan-Meier分析的置信區間 207
4.6.5 不帶因子的壽命表計算法示例 209
4.6.6 帶有因子的壽命表法計算示例 212
4.6.7 計算生存分析的首要條件 216
4.7 Cox回歸 218
4.7.1 Cox模型簡介和背景知識 218
4.7.2 帶有定量協變數的Cox回歸 222
4.7.3 帶有二元協變數的Cox回歸(k=2) 230
4.7.4 帶有分類協變數的Cox回歸(k>2) 233
4.7.5 針對互動作用的Cox回歸 237
4.7.6 檢驗Cox回歸的前提條件 249
4.7.7 帶有時間相依的定量協變數的Cox回歸 256
4.7.8 Cox回歸的特定前提條件 261
4.7.9 附錄:對比方法 264
第5章 回歸分析的其他套用實例 269
5.1 偏回歸 270
5.1.1 運用PLS過程(Python Extension)進行計算 271
5.1.2 運用SPSS過程REGRESSION進行計算 278
5.2 個體生長曲線 281
5.2.1 方法1:隨機截距模型 282
5.2.2 方法2:隨機斜率模型 286
5.2.3 方法3:隨機截距和隨機斜率模型 288
5.3 嶺回歸(SPSS宏) 290
5.3.1 利用嶺跡實現多重共線性的可視化 291
5.3.2 嶺回歸的計算 294
5.3.3 SPSS宏“Ridge-Regression” 295
第6章 其他方法和模型(一覽) 301
6.1 通過SPSS選單調用其他回歸方法 301
6.2 可用語句調用的其他回歸形式 308
附錄A 公式 309
參考文獻 320
您對本書的建議和意見 327
作者簡介 328