版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
本資料來源統(tǒng)計(jì)分析系統(tǒng)SAS軟件敖雁(揚(yáng)州大學(xué))Tel:7979358E-mail:ay@SAS概述SAS含義:StatisticalAnalysisSystemSAS是美國使用最為廣泛的三大著名統(tǒng)計(jì)分析軟件SASSPSS和SYSTAT)之一SAS的廣泛應(yīng)用電信(運(yùn)用SAS軟件產(chǎn)品進(jìn)行網(wǎng)絡(luò)運(yùn)營分析和管理)金融(SAS幫我們發(fā)現(xiàn)有競爭力的商機(jī))保險(xiǎn)制造(SAS軟件幫助日本富士通集團(tuán)了解客戶的需求,上海寶鋼利用SAS軟件改善產(chǎn)品質(zhì)量和運(yùn)輸過程)證券公共事業(yè)(香港選擇SAS來做2001年的人口普查)美國SAS軟件研究所1966年開始研制1976年商品化1985年SASPC微機(jī)版本1987年DOS下的SAS6.03版(6.04版)推出WINDOWS下運(yùn)行,SAS6.11版,SAS6.12版,SAS8.0版,SAS8.2版,SAS9.0版,SAS9.1版操作系統(tǒng)UNIXWINDOWSDOS適用人群具有不同水平與經(jīng)驗(yàn)的用戶初學(xué)者可以較快掌握其基本操作熟練者可用于完成各種復(fù)雜的數(shù)據(jù)處理(科研工作者和統(tǒng)計(jì)學(xué)家)統(tǒng)計(jì)分析常用生物統(tǒng)計(jì)分析多變數(shù)分析試驗(yàn)設(shè)計(jì)次數(shù)資料的測驗(yàn)非參數(shù)測驗(yàn)常用生物統(tǒng)計(jì)分析描述性統(tǒng)計(jì)統(tǒng)計(jì)推斷方差分析線性相關(guān)和回歸分析協(xié)方差分析非線性回歸分析多變數(shù)分析多元方差分析主成份分析因子分析聚類分析典范相關(guān)分析第一章SAS系統(tǒng)的工作環(huán)境進(jìn)入SAS系統(tǒng)SAS主窗口與發(fā)布命令瀏覽SAS常用子窗口的功能與提交程序進(jìn)入幫助菜單瀏覽SAS主窗口與發(fā)布命令Sas主窗口
------應(yīng)用工作空間
AWS:applicationWorkSpace------顯示管理界面
DMS:DisplayManagementSystem
第二章SAS程序初步SAS系統(tǒng)對數(shù)據(jù)的管理
SAS數(shù)據(jù)集(數(shù)據(jù)文件)
SAS數(shù)據(jù)庫(存數(shù)據(jù)集)文件夾(與數(shù)據(jù)庫相對應(yīng))
使用Libname命令可以指定庫標(biāo)記。它的一般格式如下:Libname庫標(biāo)記’文件夾位置’
選項(xiàng);如:libnamea’c:\user’;臨時(shí)庫1個(gè)名為WORK永久庫多個(gè)SAS自動指定兩個(gè)庫標(biāo)記
SASUSER:永久庫c:\sas\sasuser
WORK:臨時(shí)庫在程序中引用該庫中的數(shù)據(jù)集可以省略庫標(biāo)記,即它被認(rèn)為是缺省的數(shù)據(jù)庫。c:\sas\saswork
SAS數(shù)據(jù)集則對應(yīng)文件,文件名為數(shù)據(jù)集名,而擴(kuò)展名為.sd2的文件。數(shù)據(jù)集名
庫標(biāo)記.數(shù)據(jù)集名如:libnamea’c:\user’;Dataa.new
數(shù)據(jù)步創(chuàng)建和處理數(shù)據(jù)集的一些語句:1)DATA語句它的主要功能是:標(biāo)志數(shù)據(jù)步的開始。命名將要?jiǎng)?chuàng)建的SAS數(shù)據(jù)集。DATA語句的一般形式如下:DATA
數(shù)據(jù)集名;Datanew;(work.new)INFILE語句2)INFILE語句用于從外部文件讀入數(shù)據(jù),必須出現(xiàn)在INPUT語句之前。它的主要功能是:確定一個(gè)包含原始數(shù)據(jù)的外部文本文件。INFILE語句的格式如下:INFILE
’外部文件的所在位置及名稱’
選項(xiàng);CARDS語句3)CARDS語句用于直接輸入數(shù)據(jù),標(biāo)志著數(shù)據(jù)塊的開始。格式如下:CARDS;
數(shù)據(jù)塊;
INPUT語句4)INPUT語句用于向系統(tǒng)表明如何讀入每一條記錄。它的主要功能有:讀入由語句指定的數(shù)據(jù)列。為相應(yīng)的數(shù)據(jù)域定義變量名。確定變量的讀入模式。INPUT語句的格式如下:INPUT
變量名[變量類型起止列數(shù)]...;方括號表示其中的內(nèi)容為可選,如果不輸入,系統(tǒng)會以默認(rèn)值代替。數(shù)據(jù)的三種輸入方式
【直接輸入方式】【外部文件讀入方式】【讀入其他格式的數(shù)據(jù)文件】例子:datatemp;命名將要建立的數(shù)據(jù)集為work.tempinputxy@@;要輸入的變量為x、y,并且連續(xù)輸入cards;直接輸入數(shù)據(jù),數(shù)據(jù)塊開始345678903567891023657745數(shù)據(jù)塊;數(shù)據(jù)塊結(jié)束【外部文件讀入方式】
如果剛才的數(shù)據(jù)已經(jīng)事先輸好,在硬盤上的“C:\USER”文件夾內(nèi)存為temp.dat文件,該文件內(nèi)容如下(純文本):345678903567891023657745程序datatemp;命名將要建立的數(shù)據(jù)集為work.tempInfile’c:\user\temp.dat’;指定外部數(shù)據(jù)文本文件名inputxy@@;要輸入的變量為x、y,并且連續(xù)輸入Run;數(shù)據(jù)步結(jié)束,以上語句可以執(zhí)行了【讀入其他格式的數(shù)據(jù)文件】
SAS可以利用FILE菜單上的import命令將其他格式的數(shù)據(jù)文件導(dǎo)入SAS系統(tǒng),創(chuàng)建SAS自己的數(shù)據(jù)集。可以導(dǎo)入的數(shù)據(jù)文件格式有:dBase數(shù)據(jù)庫,EXCEL工作表,LOTUS的數(shù)據(jù)庫,純文本的數(shù)據(jù)文件等1.選擇導(dǎo)入的數(shù)據(jù)格式,從下拉式菜單上選擇DBF格式,單擊NEXT按鈕。
2.給出數(shù)據(jù)文件的位置和文件名,在對話框中鍵入C:\USER\temp.DBF,或點(diǎn)BROWSE直接從上面選擇文件,選好后單擊NEXT按鈕。
3.選擇導(dǎo)入的目的地,即指定要?jiǎng)?chuàng)建的數(shù)據(jù)集的名字和存放的數(shù)據(jù)庫名,先在左面的對話框選擇數(shù)據(jù)庫名WORK(臨時(shí)庫),在右面的對話框鍵入數(shù)據(jù)集的名字li1_1,此名可任意起,少于8個(gè)字符,選擇完后,單擊FINISH按鈕,就完成了此次操作。SAS程序的程序步
PROC
過程名[DATA=數(shù)據(jù)集名][選項(xiàng)];
該過程的專用語句描述;
[VAR變量序列;][WHERE條件表達(dá)式...;]
[BY變量序列;]Run;方括號里的語句均可以省略,在這時(shí)該過程按最通常的情況來處理,即:處理最新建立的SAS數(shù)據(jù)集。處理所有的變量(或?qū)σ粋€(gè)計(jì)算過程來說處理全部數(shù)值變量)。一次處理整個(gè)數(shù)據(jù)集而不是某個(gè)子集。DATA參數(shù)、VAR語句但有時(shí)我們的要求超出了默認(rèn)方式所提供的范圍,這時(shí)就要?jiǎng)佑梅嚼ㄌ柪锏拿孛芪淦髁恕ATA參數(shù)指明所需處理的數(shù)據(jù)集名,請注意在這里它是一個(gè)參數(shù)而不是語句。VAR語句如果只想分析某一個(gè)或幾個(gè)特定的變量,則可用VAR語句指定它們。例如只想顯示變量x的列表,則PRINT過程如下:Procprint;
Varx;Run;如果想顯示x和y兩個(gè)變量,則將VAR語句改為如下形式即可:varxy;
Where語句Where語句如果你想處理的不是整個(gè)數(shù)據(jù)集而只是其中符合某種條件的子集,那么WHERE語句將會非常有用,如上例中我們只想顯示大于50的x變量的值,則在PRINT過程中加入where語句如下:Wherex>50;如果條件變?yōu)閤、y兩個(gè)變量的值都要大于50,則where語句改為:wherex>50andy>50;SAS語言中常用的邏輯表達(dá)符號有and(和)、or(或)、xor(異或)、ne(不等)等。By語句By語句如果你需要分組處理數(shù)據(jù),例如要按性別分組輸出統(tǒng)計(jì)結(jié)果,你有兩種選擇,一是用不同的where語句將同一個(gè)程序步反復(fù)寫幾遍;另一種顯然更酷的方法就是采用by語句。如上例我們想按不同的y值輸出x值,則加入by語句如下:Byy;PROCSORTDATA=數(shù)據(jù)集名;
BY變量名列;RUN;結(jié)構(gòu)化語句簡介分支(條件)語句循環(huán)語句分支(條件)語句
【語法格式】語法格式如下:IF
條件THEN
程序塊;ELSE
程序塊;【應(yīng)用實(shí)例】
例3.1在產(chǎn)生數(shù)據(jù)集temp的同時(shí)為其增加變量class,當(dāng)x>50時(shí)class=1,否則class=2。解:程序如下:datatemp;數(shù)據(jù)步開始,定義要建立的數(shù)據(jù)集為WORK.TEMP
inputxy@@;要輸入的變量為X和Y,采用數(shù)據(jù)連續(xù)讀入方式ifx>50thenclass=1;建立新變量,如果X>50,則CLASS=1
elseclass=2;否則,CLASS=2cards;數(shù)據(jù)塊開始345678903567891023657745數(shù)據(jù)塊;數(shù)據(jù)塊結(jié)束procprint;列表輸出數(shù)據(jù)集中的數(shù)據(jù),檢查有無錯(cuò)誤run;程序結(jié)束,開始運(yùn)行以上程序
循環(huán)語句
【語法格式】DO
起始條件TO
終止條件;
程序塊;END;【應(yīng)用實(shí)例】
例3.2在產(chǎn)生數(shù)據(jù)集temp的同時(shí)為其增加變量class,取值依次為1、2。解:程序如下:Datatemp;數(shù)據(jù)步開始,定義要建立的數(shù)據(jù)集為WORK庫的TEMP
doclass=1to2;循環(huán)開始,循環(huán)控制變量為CLASS,取值從1到2
inputxy@@;輸入的變量為X和Y,并且采用數(shù)據(jù)連續(xù)讀入方式
output;用OUTPUT語句將循環(huán)控制變量寫入數(shù)據(jù)集中
end;循環(huán)結(jié)束cards;數(shù)據(jù)塊開始345678903567891023657745數(shù)據(jù)塊;數(shù)據(jù)塊結(jié)束run;程序結(jié)束,開始運(yùn)行以上程序第三章統(tǒng)計(jì)圖
兩個(gè)專門用于繪圖的程序步GCHART過程,用于繪制各種常用的統(tǒng)計(jì)圖GPLOT過程,而后者則用于繪制散點(diǎn)圖。§3.1GCHART過程
【繪圖語句選項(xiàng)】
MISSING指定繪圖時(shí)要將變量的缺失值也包括在內(nèi)。
TYPE=做圖類型關(guān)鍵字指定要做圖的類型,即圖中條塊代表的含義:缺省值是頻數(shù)(FREQ);如果指定了選擇項(xiàng)SUMVAR,則缺省值為總和(SUM)??蛇x的關(guān)鍵字有:
FREQ要求按指定變量的頻數(shù)做圖。
PERCENT要求按在橫軸刻度表示范圍內(nèi)出現(xiàn)的頻數(shù)占總數(shù)的百分比做圖。
CFREQ按累計(jì)頻數(shù)做圖。
CPERCENT按累計(jì)百分比做圖。
SUM只能與SUMVAR選項(xiàng)同時(shí)使用,要求圖中的每一條代表:變量在橫軸表示的取值范圍內(nèi)時(shí),SUMVAR指定變量的總和。
MEAN只能與SUMVAR選項(xiàng)同時(shí)使用,要求圖中的每一條代表:變量在橫軸表示的取值范圍內(nèi)時(shí),SUMVAR指定變量的均數(shù)。
SUMVAR=求和變量指定使用TYPE=SUM或MEAN時(shí),用于求總和、均值的變量。
LEVAL=n如果繪圖變量是連續(xù)變量,用該選項(xiàng)產(chǎn)生有N個(gè)組段的圖形。
GROUP=分組變量要求產(chǎn)生以分組變量的值分組的并排圖。
SUBGROUP=亞組變量要求每個(gè)圖形內(nèi)部再按亞組變量的值分塊。
CAXIS=顏色指定坐標(biāo)軸的顏色。
CTEXT=顏色指定坐標(biāo)軸文本的顏色。應(yīng)用實(shí)例
§3.2GPLOT過程
【GPLOT過程的選項(xiàng)】
分層變量
表示所做的散點(diǎn)圖按指定變量的取值分層,默認(rèn)按不同顏色來區(qū)分。語句選項(xiàng)
OVERLAY同一語句做的圖重疊在同一個(gè)坐標(biāo)系中顯示。
HAXIS=數(shù)值
定義橫坐標(biāo)的刻度。
VAXIS=數(shù)值
定義縱坐標(biāo)的刻度。
CAXIS=顏色
定義坐標(biāo)軸的顏色。
CTEXT=顏色定義坐標(biāo)軸文本的顏色?!維YMBOL語句選項(xiàng)】
VALUE=符號可用的符號及相應(yīng)名稱有:+PLUS★STAR■SQUARE
◆DIAMOND▲TRIANGLEI=連線方式①JOIN用直線連接。②SPLINE用光滑的曲線連接。NEEDLE向橫坐標(biāo)畫垂線。
RL添加回歸直線。WIDTH=寬度定義數(shù)據(jù)點(diǎn)和連線的寬度。
COLOR=顏色定義
應(yīng)用實(shí)例
程序第四章定量資料的統(tǒng)計(jì)描述和t、u檢驗(yàn)
對于定量資料的統(tǒng)計(jì)描述和簡單推斷,SAS提供了三個(gè)強(qiáng)有力的程序步,它們是:UNIVARIATE過程提供單個(gè)變量的詳細(xì)描述和對其分布類型的檢驗(yàn)。MEANS過程提供單個(gè)或多個(gè)變量的簡單描述,對于多個(gè)變量,它的輸出格式緊湊,便于閱讀。TTEST過程對變量進(jìn)行t/u檢驗(yàn)。主要輸出結(jié)果NNMISS(缺值個(gè)數(shù))MINCVMAXKURTOSIS(峰度系數(shù))RANGESKEWNESS(偏度系數(shù))SUMT(t值)MEANPRT(t值概率)VAR(方差)MEDIUM(中位數(shù))STD(標(biāo)準(zhǔn)差)MODE(眾數(shù))STDERR(平均數(shù)的標(biāo)準(zhǔn)誤)MEANS過程格式Procmeans選項(xiàng);Var變量表;By變量;Class變量表;Freq變量;WEIGHT變量;Outputout=SAS數(shù)據(jù)集統(tǒng)計(jì)數(shù)=變量表;Run;求基本統(tǒng)計(jì)數(shù)單個(gè)平均數(shù)的假設(shè)測驗(yàn)兩個(gè)平均數(shù)的成對比較兩個(gè)平均數(shù)的假設(shè)測驗(yàn)成組(組群)比較成對比較成對比較
UNIVARIATE過程
Univariate過程對數(shù)值變量給出比較詳細(xì)的變量分布的描述,其中包括:變量的極端值。常用的百分位數(shù),包括四分位數(shù)和中位數(shù)。用幾個(gè)散點(diǎn)圖描繪變量的分布。頻數(shù)表。確定數(shù)據(jù)為正態(tài)分布的檢驗(yàn)。Univariate過程常用的選項(xiàng)如下NOPRINT
禁止統(tǒng)計(jì)報(bào)告在OUTPUT視窗中輸出PLOT
繪出莖葉圖、箱式圖和正態(tài)概率圖FREQ
給出頻數(shù)表NORMAL
對變量進(jìn)行正態(tài)性檢驗(yàn)【關(guān)鍵字】
SAS中用關(guān)鍵字來指定所需要的統(tǒng)計(jì)量,事實(shí)上結(jié)果輸出中用的就是各種關(guān)鍵字,常用的關(guān)鍵字有:基本統(tǒng)計(jì)量NMEANSTD(標(biāo)準(zhǔn)誤)CVSUMVAR(方差)RANG
百分位數(shù)描述MINP1P5P10Q1MEDIANQ3P90P95P99MAX
與假設(shè)檢驗(yàn)有關(guān)的統(tǒng)計(jì)量STDMEAN(標(biāo)準(zhǔn)誤)T
TTEST過程
組群比較例
將鉤體病人的血清分別用標(biāo)準(zhǔn)株和水生株做凝溶實(shí)驗(yàn),測得稀釋倍數(shù)如下。問兩組的平均效價(jià)有無區(qū)別。標(biāo)準(zhǔn)株:1002004004004004008001600160016003200
水生株:100100100200200200200400400統(tǒng)計(jì)分析系統(tǒng)SAS軟件
敖雁Tel:7979358E-mail:ay@第五章方差分析和協(xié)方差分析ANOVA過程
-----速度快,功能有限,平衡資料GLM過程
-----速度慢,但功能強(qiáng)大(非平衡資料協(xié)方差分析)其實(shí),這里的速度快慢只是相對而言,SAS的處理速度是首屈一指的。舉個(gè)例子,一個(gè)有6600條記錄的,7因素的,交叉設(shè)計(jì)的方差分析(是不是已經(jīng)有人喊頭痛了?),我先是用SPSSFORWIN957.5來做,運(yùn)行了大約10分鐘才出結(jié)果。我又換用SASFORWIN956.12來做,結(jié)果用了――2.47秒!§5.1方差分析數(shù)據(jù)集的建立技巧
5.1.1方差分析的數(shù)據(jù)集格式統(tǒng)計(jì)分析所用的數(shù)據(jù)格式和我們在分析整理資料時(shí)所用的格式是不同的:-------數(shù)據(jù)集中應(yīng)至少有一個(gè)結(jié)果變量,用于記錄不同處理因素水平下觀察值的大??;
-------至少有一個(gè)處理因素變量,用于記錄處理因素的類型及其水平數(shù)。例5.1某職業(yè)病防治院對31名石棉礦工中的石棉肺患者、可疑患者及非患者進(jìn)行了用力肺活量測定,請給出數(shù)據(jù)集的結(jié)構(gòu)。解:數(shù)據(jù)集中應(yīng)有兩個(gè)變量,x和group。x記錄肺活量的大??;group取值為1、2或3,分別代表石棉肺患者、可疑患者及非患者。例5.2某廠醫(yī)務(wù)室測定了10名氟作業(yè)工人工前、工中及工后4小時(shí)的尿氟濃度,請給出數(shù)據(jù)集的結(jié)構(gòu)。解:數(shù)據(jù)集中應(yīng)有三個(gè)變量,x、group和worker。x記錄尿氟濃度;group取值為1、2或3,分別代表工前、工中及工后;worker取值為1到10,分別代表10名工人。5.1.2方差分析數(shù)據(jù)集的建立技巧可見方差分析的數(shù)據(jù)集其變量取值有一定的規(guī)律,因此可以利用循環(huán)語句和判斷語句來簡化輸入。例5.3請建立例5.1的數(shù)據(jù)集。
例5.4請建立例5.2的數(shù)據(jù)集。
§5.2引
例
例5.5請回答在例5.1中三組石棉礦工的用力肺活量有無差別?解:對于單因素的方差分析,在比較之前一般要考慮方差齊性的問題。這里可以用GLM過程中的HOVTEST選項(xiàng)實(shí)現(xiàn),實(shí)際上這也是在SAS中做方差齊性檢驗(yàn)的唯一途徑?!?.3ANOVA過程
5.3.2語法說明
Means語句的選項(xiàng)主要用來指定兩兩比較的方法和檢驗(yàn)水準(zhǔn),主要有:兩兩比較方法BON(Bonferroni檢驗(yàn))、DUNCAN(新復(fù)極差法)、DUNNETT、GABRIEL、LSD(最小顯著差法T)、SCHEFFE、SIDAK、SNK(q檢驗(yàn))、TUKEY、WALLER
其它ALPHA=p值更改水準(zhǔn)5.3.3結(jié)果解釋
方差分析的統(tǒng)計(jì)結(jié)果部分
§5.4GLM過程
GLM過程:GeneralLinerModel過程,它使用最小二乘法對數(shù)據(jù)擬合廣義線形模型。GLM過程中可以進(jìn)行回歸分析、方差分析、協(xié)方差分析、劑量――反應(yīng)模型分析、多元方差分析和偏相關(guān)分析等等,其功能之強(qiáng)大可見一斑。5.4.1語法格式
這里我們只解釋協(xié)方差分析的做法:由于協(xié)變量并非我們研究的處理因素,因此在CLASS語句中不能有它的位置;但是,另一方面協(xié)變量要影響結(jié)果變量的取值,因此必須在模型中引入,怎么辦?只要在MODEL語句中將其寫入即可(寫在分析變量的首位)。5.4.2結(jié)果解釋
GLM過程的結(jié)果和ANOVA過程是雷同的――注意是雷同而不是相同。在處理因素、協(xié)變量及交互作用的檢驗(yàn)結(jié)果部分,GLM過程會給出兩種結(jié)果(Ⅰ類和Ⅲ類結(jié)果)。在我們用到的范圍里,兩種結(jié)果是完全相同的,所以用哪一種都可以。5.4.3應(yīng)用實(shí)例
方差分析基礎(chǔ)常用試驗(yàn)設(shè)計(jì)的ANOVA缺省數(shù)據(jù)的方差分析方差分析基礎(chǔ)單向分組資料的ANOVE1)樣本容量相等(modely=trt)2)樣本容量不相等(modely=trt)3)數(shù)據(jù)轉(zhuǎn)換(modelyp=trt)
單一自由度的比較(modely=trt)兩向分組資料的ANOVA(modely=mh)系統(tǒng)分組資料的ANOVA(modely=trtpot(trt))常用試驗(yàn)設(shè)計(jì)的ANOVA
完全隨機(jī)化設(shè)計(jì)(單向分組資料…)隨機(jī)區(qū)組設(shè)計(jì)
1)單因素(modely=blktrt)2)兩因素(modely=blkaba*b)3)三因素(modely=blkaba*bca*cb*ca*b*c)(modely=blka|b|c)拉丁方設(shè)計(jì)(modely=rct)二裂式裂區(qū)設(shè)計(jì)(modely=blkaa*blkba*b)多點(diǎn)品種區(qū)域試驗(yàn)(modely=r(u)uvu*v)模型定義中可用|和@n簡化表達(dá)方法協(xié)方差分析過程格式PROCGLM選項(xiàng);CLASS變量表;MODEL依變量=效應(yīng)/選項(xiàng);MEANS效應(yīng)/選項(xiàng);LSMEANS效應(yīng)/選項(xiàng);PROCGLM語句選項(xiàng)可設(shè)定分析數(shù)據(jù)集等;CLASS指明分類變量,協(xié)方差分析時(shí)必須設(shè)定,必須在MODEL語句之前;MODEL定義協(xié)方差分析的線性數(shù)學(xué)模型,modely=at;一般的協(xié)方差分析模型
modely=tx(t);分離斜率模型
modely=txx*t;共斜率模型
model后SOLUTION的選項(xiàng)給出參數(shù)的估計(jì)值MEANS語句用于計(jì)算依變量的平均數(shù),選項(xiàng)用于多重比較;LSMEANS語句計(jì)算效應(yīng)的最小二乘估計(jì)的平均數(shù)(LSM)
選項(xiàng)E=效應(yīng),設(shè)定測驗(yàn)誤差項(xiàng),缺省為試驗(yàn)分析誤差.STDERR給出LSM的標(biāo)準(zhǔn)誤,TDIEF,PDIEF要求顯示測驗(yàn)H0:LSM(i)=LSM(j)的t值和概率值.應(yīng)用舉例單向分組資料的協(xié)方差分析兩向分組資料的協(xié)方差分析單因素試驗(yàn)的協(xié)方差分析第六章線性相關(guān)、回歸分析與logistic回歸相關(guān)分析(CORR)回歸分析(REG)廣義線型模型(GLM)REG過程
語法格式
語法說明
MODEL語句,必需語句,定義回歸分析模型VAR語句為可選的,指定用于計(jì)算交叉積的變量PLOT語句為可選的,用于繪制變量間的散點(diǎn)圖,還可添加回歸線?!具^程選項(xiàng)】
OUTEST=數(shù)據(jù)集名指定統(tǒng)計(jì)量和參數(shù)估計(jì)輸出的新數(shù)據(jù)集名。NOPRINT禁止統(tǒng)計(jì)結(jié)果在OUTPUT視窗中輸出。SIMPLE輸出REG過程中所用的每個(gè)變量的基本統(tǒng)計(jì)量。CORR輸出MODEL語句或VAR語句中所列變量的相關(guān)矩陣。ALL等價(jià)于MODEL語句加上全部選項(xiàng),即輸出該語句所有選項(xiàng)分析結(jié)果?!綧ODEL語句】
MODEL語句定義模型中的因變量、自變量、模型選項(xiàng)及結(jié)果輸出選項(xiàng)。語句中的變量只能是數(shù)據(jù)集中的變量,任何形式的變換都必須先產(chǎn)生一個(gè)新變量,然后用于分析。如X1的二次項(xiàng),不能在模型中直接指定X1*X1,而要產(chǎn)生另一個(gè)新變量代表X1*X1,方可引入模型。MODEL語句中常用的選項(xiàng)
NOINT在模型中不擬合常數(shù)項(xiàng)。STB輸出標(biāo)準(zhǔn)化回歸系數(shù)。CLI輸出個(gè)體預(yù)測值的95%可信區(qū)間上下限。CLM輸出因變量期望值(均值)的95%可信區(qū)間上下限。R輸出個(gè)體預(yù)測值、殘差及其標(biāo)準(zhǔn)誤。P輸出實(shí)際值Yi、預(yù)測值和殘差等。如已選擇了CLI、CLM和R,則無需選擇P。【關(guān)鍵字】結(jié)果解釋
如果在MODEL語句中使用CLI、CLM選項(xiàng),則系統(tǒng)輸出因變量均值以及個(gè)體預(yù)測值的95%可信區(qū)間上下限,輸出如下
CORR過程
PROCCORR
[選項(xiàng)];
[VAR變量名列;[1]
WITH變量名列;[2]
WEIGHT變量名;
FREQ變量名;
BY變量名列;]語法說明
除了PROC語句為必需,其他語句都是可選的,如果省略所有的可選語句,則對所有變量作相關(guān)分析。VAR語句,可選的語句,定義相關(guān)分析的變量WITH語句,可選的語句,定義分析相關(guān)性的另一組變量PROCCORR;
VARAB;WITHXYZ;結(jié)果解釋
例
下表給出了12名不同年齡(歲,X)婦女的收縮壓測量值(mmHg,Y),試進(jìn)行回歸分析。
(1)制作散點(diǎn)圖;(2)建立由X預(yù)報(bào)的回歸方程,制作回歸直線;(3)對回歸方程及回歸系數(shù)b進(jìn)行假設(shè)檢驗(yàn);(4)繪制的95%可信區(qū)間;(5)建立單個(gè)Y值的預(yù)報(bào)方程;(6)計(jì)算積矩相關(guān)系數(shù),并進(jìn)行假設(shè)檢驗(yàn)。多元線性回歸
REG過程:只要把要分析的多個(gè)自變量名放在MODEL語句中應(yīng)變量后即可。語法選項(xiàng)
(MODEL語句選項(xiàng))SELECTION=method,規(guī)定變量篩選的方法,method可以是以下幾種選項(xiàng)FORWARD(或F),前進(jìn)法,按照SLE規(guī)定的P值從無到有依次選一個(gè)變量進(jìn)入模型BACKWARD(或B),后退法,按照SLS規(guī)定的P值從含有全部變量的模型開始,依次剔除一個(gè)變量STEPWISE(或S),逐步法,按照SLE的標(biāo)準(zhǔn)依次選入變量,同時(shí)對模型中現(xiàn)有的變量按SLS的標(biāo)準(zhǔn)剔除不顯著的變量MODEL語句選項(xiàng)NONE,即不選擇任何選項(xiàng),不作任何變量篩選,此時(shí)使用的是含有全部自變量的全回歸模型MODEL語句選項(xiàng)SLE=概率值,入選標(biāo)準(zhǔn),規(guī)定變量入選模型的顯著性水平,前進(jìn)法的默認(rèn)是0.5,逐步法是0.15SLS=概率值,剔除標(biāo)準(zhǔn),指定變量保留在模型的顯著水平,后退法默認(rèn)為0.10,逐步法是0.15標(biāo)準(zhǔn)化偏回歸系數(shù)STB可用來比較各個(gè)自變量作用的大小COLLIN要求詳細(xì)分析自變量之間的共線性,給出信息矩陣的特征根和條件數(shù),來判斷自變量之間有無多重共線性。
應(yīng)用實(shí)例
現(xiàn)有20名糖尿病人的血糖(y,mmol/L)、胰島素(X1,mU/L))及生長素(X2,μg/L)的測量數(shù)據(jù)列于中,試進(jìn)行多元線性回歸分析
程序如下databk4_1;inputidyx1x2@@;cards;…;procregdata=bk4_1;
modely=x1x2/stb;
modely=x1x2/selection=stepwisestb;run;程序運(yùn)行的主要結(jié)果相關(guān)和偏相關(guān)分析REG過程
logistic回歸
如果應(yīng)變量為分類的變量,則不符合一般回歸分析模型的要求,可用logistic回歸來分析。Logistic回歸按反應(yīng)變量的類型分為:兩分類的Logistic回歸多分類有序反應(yīng)變量的Logistic回歸多分類無序
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 二零二五版教育機(jī)構(gòu)學(xué)生助學(xué)貸款合同樣本2篇
- 2025年互聯(lián)網(wǎng)流量統(tǒng)計(jì)分析與優(yōu)化服務(wù)合同4篇
- 2025年校企合作產(chǎn)學(xué)研合作項(xiàng)目合同3篇
- 二零二五年度摩托車行業(yè)人才培養(yǎng)及輸送合同4篇
- 二零二五年建筑工程合同審查要點(diǎn)與論文綜述3篇
- 二零二五年度無人駕駛汽車測試運(yùn)營合同樣本4篇
- 二零二五版參股合作投資合同范本解析12篇
- 二零二五年度鋁合金窗安裝與智能化家居系統(tǒng)合同3篇
- 2025年度電子商務(wù)平臺入駐合作定金合同4篇
- 二零二五版股權(quán)并購?fù)顿Y合同范本3篇
- 2025年中國高純生鐵行業(yè)政策、市場規(guī)模及投資前景研究報(bào)告(智研咨詢發(fā)布)
- 2022-2024年浙江中考英語試題匯編:完形填空(學(xué)生版)
- 2025年廣東省廣州市荔灣區(qū)各街道辦事處招聘90人歷年高頻重點(diǎn)提升(共500題)附帶答案詳解
- 中試部培訓(xùn)資料
- 硝化棉是天然纖維素硝化棉制造行業(yè)分析報(bào)告
- 央視網(wǎng)2025亞冬會營銷方案
- 北師大版數(shù)學(xué)三年級下冊豎式計(jì)算題100道
- 計(jì)算機(jī)網(wǎng)絡(luò)技術(shù)全套教學(xué)課件
- 屋頂分布式光伏發(fā)電項(xiàng)目施工重點(diǎn)難點(diǎn)分析及應(yīng)對措施
- 胃鏡下超聲穿刺護(hù)理配合
- 2024解析:第三章物態(tài)變化-基礎(chǔ)練(原卷版)
評論
0/150
提交評論