內容簡介
《SAS數據挖掘與分析》囊括了SAS編程方面極為詳盡的命令語句,是數據的科學挖掘和統計分析方面的一本不可多得的教科書。
《SAS數據挖掘與分析》的前8章介紹了數據挖掘和統計分析所用的各類命令語句,第9~17章著重介紹如何用命令語句及其對話框進行常用的初高級統計和專業統計,並對統計結果進行了科學準確的分析。
《SAS數據挖掘與分析》面向全國高校統計學、醫學、心理學、市場行銷學、人文社會學、信息管理學及財經學等專業的本科生和研究生,可作為這些專業及其他非計算機專業學生必選的統計教材,也是數據挖掘和信息分析方面的利器。
編輯推薦
《SAS數據挖掘與分析》是教據的科學挖掘和統計分析方面一本不可多得的教材,前半部分介紹了各種數據挖掘和統計分析所用的各類命令語句,後半部分著重介紹如何用命令語句及其對話框進行常用的初高級統計和專業統計,並對統計結果進行既科學又準確的分析,後半部分融會了作者在數據挖掘和信息分析領域教學和研究的經驗與成果,是《SAS數據挖掘與分析》的精華所在。
目錄
第1章SAS編程的語法知識
1.1SAS(StatisticalAnalysisSystem)概述
1.2觀測值、變數常量
1.3SAS的操作符
1.4SAS數據挖掘常用的語句
習題
第2章數據挖掘的預備知識
2.1DATA語句
2.2Input語句
2.3LENGTH語句
2.4用LABEL語句指定變數標籤
2.5用PROCFORMAT過程指定數據標籤
2.6用MISSING語句宣告缺失值
2.7注釋語句
2.8創建新變數
2.9缺失值不參與運算
2.10求和語句
2.11刪除變數
2.12用INFILE語句讀取外部檔案的數據
習題
第3章數據挖掘時的跳轉與循環
3.1IF語句
3.1.1IFTHEN語句
3.1.2IFTHEN/ELSE語句
3.2GOTO語句
3.3LINK語句
3.4RETURN語句
3.5刪除部分個案
3.5.1刪除數據集裡暫時不用的個案
3.5.2用IF語句挖掘部分數字型的個案
3.6循環語句
3.7數組
3.7.1下標變數的下標
3.7.2在DOEND循環中使用數組
3.7.3多維數組
習題
第4章建立數據倉庫
4.1建立永久數據集
4.2數據的分組及分組標記
4.2.1分組控制
4.2.2數據的分組標記
4.3數據的排序
4.4數據集的連線
4.4.1變數相同時的連線
4.4.2變數不同時的連線
4.4.3變數值相同時的個案連線
4.5數據集“合二而一”
4.5.1按個案號配對合併變數
4.5.2用BY語句進行匹配合併
4.6用FILE語句控制輸出檔案
4.7OUTPUT語句
4.7.1OUTPUT語句格式
4.7.2一個個案的變數分幾行輸出
4.7.3一個DATA步創建多個數據集
4.8用DATASETS過程修改數據集
4.9查閱數據集的信息
習題
第5章數據挖掘的過程引論
5.1DATA語句
5.2INFILE語句
5.3INPUT語句
5.3.1用INPUT語句定義固定格式的變數
5.3.2用INPUT語句定義自由格式的變數
5.3.3用INPUT語句指定格式化的輸入方式
5.3.4INPUT語句含有挖掘功能
5.4用LABEL語句定義變數標籤
5.5用FORMAT及VALUE語句定義數值標籤
5.5.1定義數值標籤
5.5.2指定“格式化輸入”
5.5.3用FORMAT語句指定變數值的格式
5.6用TITLE語句顯示標題
5.7數據挖掘常用的統計過程
5.7.1用PROCFREQ過程做簡單的頻數分布
5.7.2用PROCCHART過程畫圖
5.7.3用PROCPLOT過程畫散點圖
5.7.4用PROCMEANS過程統計均值分布
5.7.5用PROCRANK過程統計秩和分布
5.7.6用PROCTABULATE制表
5.7.7用PROCUNIVARIATE過程做詳盡的頻數分布
5.7.8用PROCDBF過程調用dBASE資料庫數據
5.7.9用PROCPRINT過程顯示數據集的信息
5.7.10用PROCSORT過程對數據排序
5.7.11用PROCSTANDARD過程對變數標準化
5.5.12用TRANSPOSE過程轉置數據
習題
第6章通過描述統計挖掘數據
6.1用FREQ過程做單雙變數的頻數統計
6.1.1FREQ過程命令
6.1.2FREQ過程與其他過程的連用
6.2單變數頻數分布
6.3雙變數交叉匯總和結合測量
6.3.1雙變數頻數統計的過程命令
6.3.2“定類-定類”雙變數交叉匯總與結合測量
6.3.3“定比-定比”雙變數交叉匯總與結合測量
6.3.4“定序-定序”雙變數交叉匯總與結合測量
6.4再用UNIVARIATE過程詳細描述單變數
6.4.1舉例
6.4.2UNIVARIATE過程命令
6.4.3計算方法
6.5進一步用PROCCHART過程描述單變數
6.5.1PROCCHART過程命令
6.5.2CHART的選項
6.6用MEANS過程比較兩個均值
6.6.1套用實例
6.6.2MEANS過程命令
6.7用PROCPLOT過程畫散點圖
6.8用RANK過程進行非參數檢驗
6.8.1什麼是秩分
6.8.2RANK過程命令
6.8.3秩分計算
6.8.4運用舉例
習題
第7章均值比較與T檢驗
7.1均值比較的方法
7.1.1配對樣本的均值比較
7.1.2兩個獨立樣本的均值差檢驗
7.2MEANS過程及其t統計量
7.3TTEST過程及其t檢驗
7.4非參數檢驗
7.4.1用NPAR1WAY過程做非參數檢驗
7.4.2舉例
習題
第8章方差分析
8.1用ANOVA做均衡數據的方差分析
8.1.1ANOVA過程命令
8.1.2單因素方差分析
8.1.3雙因素方差分析
8.1.4三因素方差分析
8.1.5R*C互動因素的方差分析
8.1.6多個實驗組與對照組的均值比較
8.1.7用SNK的Q檢驗法比較組間均值
8.2用GLM進行非均衡數據方差分析
8.2.1GLM過程命令
8.2.2GLM過程的統計功能
8.2.3用GLM做單因素3水平方差分析
8.2.4用GLM做二因素方差分析
8.3協方差分析
8.3.1GLM過程命令
8.3.2用GLM做協方差分析
習題
第9章相關分析
9.1數據的4種測量水平
9.2皮爾遜積差相關
9.2.1皮爾遜相關係數CORR的計算公式
9.2.2皮爾遜相關係數的測量
9.2.3皮爾遜相關係數CORR的分析
9.3皮爾遜二分“點-距”相關
9.4肯氏(Kendall)等級相關τ?b
9.4.1計算肯氏等級相關係數的數據
9.4.2通過Analyst中的對話框計算肯氏相關係數τ?b
9.4.3肯氏相關係數τ?b結果分析
9.5計算次序-比率數據的肯氏相關係數
9.5.1次序-比率數據例子
9.5.2計算次序-比率數據的Eta係數
9.5.3肯氏相關係數τ?b結果分析
9.6斯皮爾曼等級相關
9.6.1斯皮爾曼等級相關係數的計算公式
9.6.2用“分析家”對話框測量等級相關
9.6.3Spearman相關係數的分析
9.7“標稱-標稱”型變數的相關測量
9.8Cronbach的Alpha係數與Spearman相關係數
9.9用PROCCORR過程編程計算相關係數
習題
第10章用GLM過程進行回歸分析
10.1最小平方法的原理
10.1.1方差分析
10.1.2統計量F
10.1.3回歸係數Β計算法
10.1.4判定係數R
10.1.5殘差分析
10.1.6DW統計量D
10.2GLM中各語句的格式
10.3GLM程式各語句的使用說明
10.4調用GLM程式作一元線性回歸
10.4.1數據與程式
10.4.2數據分析
10.4.3結果分析
10.5調用GLM程式進行多元線性回歸分析
10.6調用GLM程式進行多項式回歸
10.6.1多項式回歸的一般模型
10.6.2多項式回歸的實例
10.7虛擬變數的用法
習題
第11章採用REG過程進行多元線性回歸分析
11.1用Analyst對話框做多元線性回歸
11.2REG過程的語句格式
11.2.1REG程式中的語句及任選項
11.2.2REG程式中主要語句及關鍵字的註解
11.3REG程式進一步實例
11.4MAXR回歸法和RSQUARE回歸法
11.4.1MAXR回歸法
11.4.2RSQUARE回歸法
11.4.3實用程式及圖例
習題
第12章路徑分析
12.1路徑分析所用的程式
12.2圖形輸出
12.3路徑圖的分析方法
習題
第13章生存分析
13.1名詞引論
13.2用LIFEREG進行生存分析
13.2.1LIFEREG過程命令
13.2.2LIFEREG過程的套用實例
13.3用LIFETEST過程進行生存檢驗
習題
第14章非線性回歸分析一:對數與多項式回歸
14.1對數曲線回歸
14.1.1對數曲線回歸所要求的數據
14.1.2對數曲線回歸的編程解法
14.2對數曲線回歸分析
14.3擬合拋物線的多項式回歸
14.3.1多項式回歸分析的原始數據
14.3.2多項式回歸的方程式
14.3.3多項式回歸的SAS程式
14.4多項式回歸的結果與分析
14.4.1多項式回歸的輸出結果
14.4.2改用“分析家”對話框法進行多項式回歸
14.4.3擬合大學生生長發育的二次曲線模型
習題
第15章非線性回歸二:Logistic回歸與指數回歸
15.1Logistic曲線回歸
15.2從Logistic曲線模型解出初始值
15.3擬合Logistic曲線回歸的分析
15.3.1參數估計
15.3.2參數近似的置信區間
15.3.3用Logistic曲線預測人口
15.4負指數生長曲線回歸
15.5分析負指數生長曲線
15.6擬合指數曲線Y=AeBX回歸
15.6.1建立指數曲線Y=AeBX的回歸模型
15.6.2分析指數曲線Y=AeBX回歸結果
15.6.3指數曲線的預測
習題
第16章用Logistic過程做邏輯斯蒂克回歸
16.1邏輯斯蒂克回歸模型
16.2Logistic回歸過程對數據的要求
16.3用“分析家”對話框做Logistic回歸
16.4用編程法做邏輯斯蒂克回歸
16.5假設與檢驗
16.6解釋回歸係數
16.7機率預測
16.8多分變數的編碼
習題
第17章2*2維LogisticRegression回歸分析
17.12*2維LogisticRegression模型
17.22*2維LogisticRegression的變數及其數據
17.3用“分析家”對話框進行2*2維Logistic回歸
17.42*2維Logistic回歸分析
習題
……