SAS數據挖掘與分析

SAS數據挖掘與分析

《SAS數據挖掘與分析》,是2008年清華大學出版社出版的圖書。

基本信息

內容簡介

《SAS數據挖掘與分析》

《SAS數據挖掘與分析》囊括了SAS編程方面極為詳盡的命令語句,是數據的科學挖掘和統計分析方面的一本不可多得的教科書。

《SAS數據挖掘與分析》的前8章介紹了數據挖掘和統計分析所用的各類命令語句,第9~17章著重介紹如何用命令語句及其對話框進行常用的初高級統計和專業統計,並對統計結果進行了科學準確的分析。

《SAS數據挖掘與分析》面向全國高校統計學醫學心理學市場行銷學、人文社會學、信息管理學及財經學等專業的本科生和研究生,可作為這些專業及其他非計算機專業學生必選的統計教材,也是數據挖掘和信息分析方面的利器。

編輯推薦

《SAS數據挖掘與分析》是教據的科學挖掘和統計分析方面一本不可多得的教材,前半部分介紹了各種數據挖掘和統計分析所用的各類命令語句,後半部分著重介紹如何用命令語句及其對話框進行常用的初高級統計和專業統計,並對統計結果進行既科學又準確的分析,後半部分融會了作者在數據挖掘和信息分析領域教學和研究的經驗與成果,是《SAS數據挖掘與分析》的精華所在。

目錄

第1章SAS編程的語法知識

1.1SAS(StatisticalAnalysisSystem)概述

1.2觀測值、變數常量

1.3SAS的操作符

1.4SAS數據挖掘常用的語句

習題

第2章數據挖掘的預備知識

2.1DATA語句

2.2Input語句

2.3LENGTH語句

2.4用LABEL語句指定變數標籤

2.5用PROCFORMAT過程指定數據標籤

2.6用MISSING語句宣告缺失值

2.7注釋語句

2.8創建新變數

2.9缺失值不參與運算

2.10求和語句

2.11刪除變數

2.12用INFILE語句讀取外部檔案的數據

習題

第3章數據挖掘時的跳轉與循環

3.1IF語句

3.1.1IFTHEN語句

3.1.2IFTHEN/ELSE語句

3.2GOTO語句

3.3LINK語句

3.4RETURN語句

3.5刪除部分個案

3.5.1刪除數據集裡暫時不用的個案

3.5.2用IF語句挖掘部分數字型的個案

3.6循環語句

3.7數組

3.7.1下標變數的下標

3.7.2在DOEND循環中使用數組

3.7.3多維數組

習題

第4章建立數據倉庫

4.1建立永久數據集

4.2數據的分組及分組標記

4.2.1分組控制

4.2.2數據的分組標記

4.3數據的排序

4.4數據集的連線

4.4.1變數相同時的連線

4.4.2變數不同時的連線

4.4.3變數值相同時的個案連線

4.5數據集“合二而一”

4.5.1按個案號配對合併變數

4.5.2用BY語句進行匹配合併

4.6用FILE語句控制輸出檔案

4.7OUTPUT語句

4.7.1OUTPUT語句格式

4.7.2一個個案的變數分幾行輸出

4.7.3一個DATA步創建多個數據集

4.8用DATASETS過程修改數據集

4.9查閱數據集的信息

習題

第5章數據挖掘的過程引論

5.1DATA語句

5.2INFILE語句

5.3INPUT語句

5.3.1用INPUT語句定義固定格式的變數

5.3.2用INPUT語句定義自由格式的變數

5.3.3用INPUT語句指定格式化的輸入方式

5.3.4INPUT語句含有挖掘功能

5.4用LABEL語句定義變數標籤

5.5用FORMAT及VALUE語句定義數值標籤

5.5.1定義數值標籤

5.5.2指定“格式化輸入”

5.5.3用FORMAT語句指定變數值的格式

5.6用TITLE語句顯示標題

5.7數據挖掘常用的統計過程

5.7.1用PROCFREQ過程做簡單的頻數分布

5.7.2用PROCCHART過程畫圖

5.7.3用PROCPLOT過程畫散點圖

5.7.4用PROCMEANS過程統計均值分布

5.7.5用PROCRANK過程統計秩和分布

5.7.6用PROCTABULATE制表

5.7.7用PROCUNIVARIATE過程做詳盡的頻數分布

5.7.8用PROCDBF過程調用dBASE資料庫數據

5.7.9用PROCPRINT過程顯示數據集的信息

5.7.10用PROCSORT過程對數據排序

5.7.11用PROCSTANDARD過程對變數標準化

5.5.12用TRANSPOSE過程轉置數據

習題

第6章通過描述統計挖掘數據

6.1用FREQ過程做單雙變數的頻數統計

6.1.1FREQ過程命令

6.1.2FREQ過程與其他過程的連用

6.2單變數頻數分布

6.3雙變數交叉匯總和結合測量

6.3.1雙變數頻數統計的過程命令

6.3.2“定類-定類”雙變數交叉匯總與結合測量

6.3.3“定比-定比”雙變數交叉匯總與結合測量

6.3.4“定序-定序”雙變數交叉匯總與結合測量

6.4再用UNIVARIATE過程詳細描述單變數

6.4.1舉例

6.4.2UNIVARIATE過程命令

6.4.3計算方法

6.5進一步用PROCCHART過程描述單變數

6.5.1PROCCHART過程命令

6.5.2CHART的選項

6.6用MEANS過程比較兩個均值

6.6.1套用實例

6.6.2MEANS過程命令

6.7用PROCPLOT過程畫散點圖

6.8用RANK過程進行非參數檢驗

6.8.1什麼是秩分

6.8.2RANK過程命令

6.8.3秩分計算

6.8.4運用舉例

習題

第7章均值比較與T檢驗

7.1均值比較的方法

7.1.1配對樣本的均值比較

7.1.2兩個獨立樣本的均值差檢驗

7.2MEANS過程及其t統計量

7.3TTEST過程及其t檢驗

7.4非參數檢驗

7.4.1用NPAR1WAY過程做非參數檢驗

7.4.2舉例

習題

第8章方差分析

8.1用ANOVA做均衡數據的方差分析

8.1.1ANOVA過程命令

8.1.2單因素方差分析

8.1.3雙因素方差分析

8.1.4三因素方差分析

8.1.5R*C互動因素的方差分析

8.1.6多個實驗組與對照組的均值比較

8.1.7用SNK的Q檢驗法比較組間均值

8.2用GLM進行非均衡數據方差分析

8.2.1GLM過程命令

8.2.2GLM過程的統計功能

8.2.3用GLM做單因素3水平方差分析

8.2.4用GLM做二因素方差分析

8.3協方差分析

8.3.1GLM過程命令

8.3.2用GLM做協方差分析

習題

第9章相關分析

9.1數據的4種測量水平

9.2皮爾遜積差相關

9.2.1皮爾遜相關係數CORR的計算公式

9.2.2皮爾遜相關係數的測量

9.2.3皮爾遜相關係數CORR的分析

9.3皮爾遜二分“點-距”相關

9.4肯氏(Kendall)等級相關τ?b

9.4.1計算肯氏等級相關係數的數據

9.4.2通過Analyst中的對話框計算肯氏相關係數τ?b

9.4.3肯氏相關係數τ?b結果分析

9.5計算次序-比率數據的肯氏相關係數

9.5.1次序-比率數據例子

9.5.2計算次序-比率數據的Eta係數

9.5.3肯氏相關係數τ?b結果分析

9.6斯皮爾曼等級相關

9.6.1斯皮爾曼等級相關係數的計算公式

9.6.2用“分析家”對話框測量等級相關

9.6.3Spearman相關係數的分析

9.7“標稱-標稱”型變數的相關測量

9.8Cronbach的Alpha係數與Spearman相關係數

9.9用PROCCORR過程編程計算相關係數

習題

第10章用GLM過程進行回歸分析

10.1最小平方法的原理

10.1.1方差分析

10.1.2統計量F

10.1.3回歸係數Β計算法

10.1.4判定係數R

10.1.5殘差分析

10.1.6DW統計量D

10.2GLM中各語句的格式

10.3GLM程式各語句的使用說明

10.4調用GLM程式作一元線性回歸

10.4.1數據與程式

10.4.2數據分析

10.4.3結果分析

10.5調用GLM程式進行多元線性回歸分析

10.6調用GLM程式進行多項式回歸

10.6.1多項式回歸的一般模型

10.6.2多項式回歸的實例

10.7虛擬變數的用法

習題

第11章採用REG過程進行多元線性回歸分析

11.1用Analyst對話框做多元線性回歸

11.2REG過程的語句格式

11.2.1REG程式中的語句及任選項

11.2.2REG程式中主要語句及關鍵字的註解

11.3REG程式進一步實例

11.4MAXR回歸法和RSQUARE回歸法

11.4.1MAXR回歸法

11.4.2RSQUARE回歸法

11.4.3實用程式及圖例

習題

第12章路徑分析

12.1路徑分析所用的程式

12.2圖形輸出

12.3路徑圖的分析方法

習題

第13章生存分析

13.1名詞引論

13.2用LIFEREG進行生存分析

13.2.1LIFEREG過程命令

13.2.2LIFEREG過程的套用實例

13.3用LIFETEST過程進行生存檢驗

習題

第14章非線性回歸分析一:對數與多項式回歸

14.1對數曲線回歸

14.1.1對數曲線回歸所要求的數據

14.1.2對數曲線回歸的編程解法

14.2對數曲線回歸分析

14.3擬合拋物線的多項式回歸

14.3.1多項式回歸分析的原始數據

14.3.2多項式回歸的方程式

14.3.3多項式回歸的SAS程式

14.4多項式回歸的結果與分析

14.4.1多項式回歸的輸出結果

14.4.2改用“分析家”對話框法進行多項式回歸

14.4.3擬合大學生生長發育的二次曲線模型

習題

第15章非線性回歸二:Logistic回歸與指數回歸

15.1Logistic曲線回歸

15.2從Logistic曲線模型解出初始值

15.3擬合Logistic曲線回歸的分析

15.3.1參數估計

15.3.2參數近似的置信區間

15.3.3用Logistic曲線預測人口

15.4負指數生長曲線回歸

15.5分析負指數生長曲線

15.6擬合指數曲線Y=AeBX回歸

15.6.1建立指數曲線Y=AeBX的回歸模型

15.6.2分析指數曲線Y=AeBX回歸結果

15.6.3指數曲線的預測

習題

第16章用Logistic過程做邏輯斯蒂克回歸

16.1邏輯斯蒂克回歸模型

16.2Logistic回歸過程對數據的要求

16.3用“分析家”對話框做Logistic回歸

16.4用編程法做邏輯斯蒂克回歸

16.5假設與檢驗

16.6解釋回歸係數

16.7機率預測

16.8多分變數的編碼

習題

第17章2*2維LogisticRegression回歸分析

17.12*2維LogisticRegression模型

17.22*2維LogisticRegression的變數及其數據

17.3用“分析家”對話框進行2*2維Logistic回歸

17.42*2維Logistic回歸分析

習題

……

相關搜尋

熱門詞條

聯絡我們