




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
1、統(tǒng)計(jì)分析系統(tǒng)SAS應(yīng)用7、相關(guān)和回歸分析概述在科學(xué)研究和生產(chǎn)實(shí)踐中,經(jīng)常需要進(jìn)行兩類變量之間關(guān)系的分析。例如作物產(chǎn)量和種植密度、害蟲的發(fā)生量和氣象因子、動(dòng)物的體重和生長(zhǎng)天數(shù)等,這些變量之間的關(guān)系分析即相關(guān)和回歸分析。相關(guān)和回歸分析是生物學(xué)研究中最為常用的統(tǒng)計(jì)分析方法之一。7、相關(guān)和回歸分析相關(guān)和回歸分析基本概念在多元統(tǒng)計(jì)分析中相關(guān)和回歸兩個(gè)概念密不可分,兩者在統(tǒng)計(jì)學(xué)中的應(yīng)用都很廣泛。相關(guān)分析(Correlation Analysis)是用來考察兩個(gè)變量間(x與y)的相互變化的關(guān)聯(lián)關(guān)系,x與y的地位是平等的,兩變量間沒有因果關(guān)系。回歸分析(Regression Analysis)是研究一個(gè)或多個(gè)
2、依變量與另一些自變量關(guān)系的統(tǒng)計(jì)方法。主要思想是用最小二乘法擬合依變量與自變量的回歸模型,從而把具有不確定關(guān)系的若干變量轉(zhuǎn)化為有確定關(guān)系的方程模型來近似的分析,通過自變量的變化預(yù)測(cè)依變量的變化趨勢(shì)。7.1 概述相關(guān)分析計(jì)算反映各個(gè)變量之間相關(guān)密切程度和性質(zhì)的統(tǒng)計(jì)數(shù)?;貧w關(guān)系一般用反映依變量和自變量之間數(shù)量關(guān)系的回歸方程表示,求解方法通常采用最小二乘法。回歸分析依自變量個(gè)數(shù)的多少分為一元回歸和多元回歸;依依變量和自變量之間關(guān)系的性質(zhì)分為線性回歸和非線性回歸。線性相關(guān)和回歸分析的SAS過程主要有相關(guān)分析(CORR)、回歸分析(REG)和廣義線性模型(GLM)。7.2 常用過程的實(shí)現(xiàn)方法1、CORR過
3、程過程格式PROC CORR 選項(xiàng);VAR 變量表;WITH 變量表;PARTIAL 變量;1、CORR過程語句說明除了PROC語句為必需,其他語句都是可選的,如果省略所有的可選語句,則對(duì)所有變量作相關(guān)分析。 默認(rèn)情況下,CORR過程所進(jìn)行的相關(guān)分析將給出分析變量的描述性統(tǒng)計(jì)結(jié)果、Pearson相關(guān)系數(shù)以及每個(gè)分析變量所對(duì)應(yīng)的概率值。PROC CORR語句選項(xiàng)設(shè)定相關(guān)系數(shù),例如Pearson,Spearman等,缺省為Pearson相關(guān)系數(shù)。VAR語句指明分析的變量。1、CORR過程語句說明with語句設(shè)定放在左邊的變量此時(shí)var語句的變量間和with語句的變量間的相關(guān)系數(shù)不給出,只輸出兩組變
4、量間的相關(guān)系數(shù)。With語句缺省時(shí),將計(jì)算var語句的變量之間的兩兩相關(guān)系數(shù)。PARTIAL語句指明偏相關(guān)變量。設(shè)定partial變量時(shí)進(jìn)行偏相關(guān)分析。相關(guān)分析結(jié)果輸出包括簡(jiǎn)單統(tǒng)計(jì)數(shù)和相關(guān)系數(shù)及顯著性。Corr過程兩個(gè)變量之間相關(guān)分析的實(shí)例2、REG過程REG過程是一個(gè)通用的回歸過程。它采用最小二乘法擬合線性回歸模型。它還提供多種選擇最優(yōu)線性回歸方程的方法,是一個(gè)應(yīng)用最廣泛的回歸過程。過程格式Proc reg 選項(xiàng);Model 依變量自變量/選項(xiàng);Weight 變量;Print 選項(xiàng);Plot y軸變量*x軸變量;2、REG過程語句選項(xiàng)Proc reg語句Data輸入數(shù)據(jù)集Outsscp輸出數(shù)
5、據(jù)集,存儲(chǔ)平方乘積和矩陣Outest輸出數(shù)據(jù)集,存儲(chǔ)參數(shù)估計(jì)值等。Simple 給出簡(jiǎn)單統(tǒng)計(jì)數(shù)Corr 給出簡(jiǎn)單相關(guān)系數(shù)2、REG過程語句選項(xiàng)Model語句設(shè)定線性數(shù)學(xué)模型等,Selection模型選擇方法包括none(全模型)、stepwise(逐步回歸)、forward(逐個(gè)選入)、backward(逐個(gè)剔除)等。Weight語句指定加權(quán)系數(shù)變量Plot語句制作散點(diǎn)圖3、GLM過程過程格式Proc glm 選項(xiàng);Model 依變量自變量/選項(xiàng);Run;3、GLM過程語句說明Proc glm語句設(shè)定分析所用的數(shù)據(jù)集和數(shù)據(jù)顯示方式。Model語句定義模型和需要輸出的統(tǒng)計(jì)數(shù)回歸分析模型一般有以下
6、形式Model y=x; 一元線性回歸模型。Model y=x1 x2 x3; 三元線性回歸模型。Model y=x1 x2 x1*x2 x1*x1 x2*x2; 二元多項(xiàng)式回歸模型。應(yīng)用舉例7.3 多元線性回歸REG過程不僅可以完成只有一個(gè)自變量的簡(jiǎn)單直線回歸,還可以作含有多個(gè)自變量的多元線性回歸。作多元線性回歸時(shí)REG過程的語法格式與簡(jiǎn)單直線回歸的語法幾乎完全相同,只要把要分析的多個(gè)自變量名放在MODEL語句中應(yīng)變量后即可。因?yàn)槎嘣€性回歸時(shí)一般要作自變量的篩選,涉及到MODEL語句的選項(xiàng)。7.3 多元線性回歸語法選項(xiàng)SELECTION=method,規(guī)定變量篩選的方法,method可以是
7、以下幾種選項(xiàng) FORWARD(或F),前進(jìn)法,按照SLE規(guī)定的P值從無到有依次選一個(gè)變量進(jìn)入模型; BACKWARD(或B),后退法,按照SLS規(guī)定的P值從含有全部變量的模型開始,依次剔除一個(gè)變量;STEPWISE(或S),逐步法,按照SLE的標(biāo)準(zhǔn)依次選入變量,同時(shí)對(duì)模型中現(xiàn)有的變量按SLS的標(biāo)準(zhǔn)剔除不顯著的變量;NONE,即不選擇任何選項(xiàng),不作任何變量篩選,此時(shí)使用的是含有全部自變量的全回歸模型。7.3 多元線性回歸語法選項(xiàng)SELECTION=method,規(guī)定變量篩選的方法,method可以是以下幾種選項(xiàng) SLE=概率值,入選標(biāo)準(zhǔn),規(guī)定變量入選模型的顯著性水平,前進(jìn)法的默認(rèn)是0.5,逐步法
8、是0.15 SLS=概率值,剔除標(biāo)準(zhǔn),指定變量保留在模型的顯著水平,后退法默認(rèn)為0.10,逐步法是0.15 標(biāo)準(zhǔn)化偏回歸系數(shù) STB 可用來比較各個(gè)自變量作用的大小 應(yīng)用實(shí)例7.4 非線性回歸分析7.4 非線性回歸分析對(duì)于呈非線性關(guān)系的數(shù)據(jù),有時(shí)通過適當(dāng)?shù)淖兞哭D(zhuǎn)換,即可化為線性回歸方程利用REG過程求解。在SAS系統(tǒng)中,更為一般的方法是利用非線性回歸過程(NLIN)直接進(jìn)行非線性最小二乘擬合。7.4.1 NLIN過程過程格式Proc nlin 選項(xiàng);Model 依變量模型表達(dá)式;Parms 參數(shù)初值;Der.參數(shù)偏導(dǎo)表達(dá)式;Run;7.4.1 NLIN過程語句說明PROC NLIN語句選項(xiàng)Da
9、ta分析數(shù)據(jù)集Method循環(huán)迭代方法包括GAUSS(高斯牛頓法),MARQUARDT(麥夸特法),NEWTON(牛頓法),GRADIENT(梯度法)和DUD(試位法)等。MODEL語句定義非線性回歸模型,直接給出非線性回歸方程的表達(dá)式。例如Logistic方程可以寫作:y=k/(1+a*exp(-b*x))7.4.1 NLIN過程語句說明PARMS語句設(shè)定參數(shù)初始值。初始值的設(shè)定有時(shí)會(huì)對(duì)計(jì)算結(jié)果產(chǎn)生較大影響。當(dāng)?shù)荒苁諗繒r(shí),可以嘗試使用不同的初始值重新計(jì)算。DER語句給出非線性回歸方程對(duì)參數(shù)的一階或二階偏導(dǎo)。應(yīng)用實(shí)例8. 聚類分析聚類分析(Cluster Analysis)是研究物以類聚的
10、一種統(tǒng)計(jì)分析方法。用于對(duì)事物類別尚不清楚,甚至事物總共可能有幾類都不能確定的情況下進(jìn)行事物分類的場(chǎng)合。一般依樣本間的距離或相似系數(shù)進(jìn)行。聚類方法有很多,常用的有系統(tǒng)聚類法(Hierarchical Cluster)和動(dòng)態(tài)聚類法(Disjoint Cluster)。8.聚類分析系統(tǒng)聚類法按照樣本距離定義類間距離,將n個(gè)樣本各自看成一類,對(duì)兩類距離最小的樣本合并,重新計(jì)算類間距離。如此反復(fù)進(jìn)行,直到所有樣本合并成為一類。最后結(jié)果用聚類系譜圖反映。動(dòng)態(tài)聚類法基于上限-中心點(diǎn)-重心的原理,首先將n個(gè)樣本初步分成g類,作為聚類個(gè)數(shù)的“上限”,從中確定其“中心點(diǎn)”,用作迭代的起點(diǎn),然后每考察一個(gè)樣本觀察值
11、,就把它移到最靠近的類,并算出每一類的“重心”,再考察一個(gè)觀察點(diǎn)移動(dòng)到另一類。若能減少樣本對(duì)于各自中心的離差之和,則把此兩類的中心同時(shí)移到新的重心,并以重新計(jì)算重心取代原來的重心,如此反復(fù)迭代,直到再也無法降低樣本與重心離差之和為止,移動(dòng)終止,分成g類。8. 聚類分析SAS軟件主要有以下4個(gè)聚類過程:CLUSTERFASTCLUSVARCLUSTREE8.1 CLUSTER過程過程格式PROC CLUSTER 選項(xiàng);VAR 變量表;COPY 變量表;RUN;8.1 CLUSTER過程語法格式PROC CLUSTER選項(xiàng)DATA=數(shù)據(jù)數(shù)據(jù)集OUTTREE=輸出數(shù)據(jù)集,供TREE過程調(diào)用METHO
12、D=算法主要算法包括:WARD(離差平方和法),AVERAGE(類平均法),CENTROID(重心法),COMPLETE(最長(zhǎng)距離法),SINGLE(最短距離法),MEDIAN(中間距離法),DENSITY(密度法),F(xiàn)LEXIBLE(可變距離法),TWOSTAGE(兩段連鎖密度法)8.1 CLUSTER過程語法格式VAR語句此語句列出在聚類分析中所使用的數(shù)值型變量。缺省時(shí)使用全部變量。COPY語句指明從輸入數(shù)據(jù)集中拷貝一些變量到輸出數(shù)據(jù)集中。8.2 TREE過程本過程利用CLUSTER過程和VARCLUSTER過程生成的數(shù)據(jù)集繪制樹狀結(jié)構(gòu)圖。過程格式PROC TREE 選項(xiàng);RUN;語句說明PROC TREE選項(xiàng)DATA=輸入數(shù)據(jù)集OUT=輸出數(shù)據(jù)集Horizontal 規(guī)定樹的高度為水平方向,根在左側(cè),如缺省,則高度軸為垂直方向,根在上部。8.3 FASTCLUS過程FASTCLUS過程叫動(dòng)態(tài)聚類過程,也叫快速聚類。它是在一個(gè)變量或幾個(gè)變量的歐式距離基礎(chǔ)上對(duì)數(shù)據(jù)進(jìn)行分類,這些類之間互
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025━2030年中國(guó)冷軋橫切/飛剪設(shè)備項(xiàng)目投資可行性研究報(bào)告
- 2024年中國(guó)熱軋酸洗板市場(chǎng)調(diào)查研究報(bào)告
- 高三上學(xué)期班主任工作計(jì)劃4篇
- 2025年帶鋼傳輸自動(dòng)糾偏裝置項(xiàng)目建議書
- 脂肪墊損傷治療
- 2025年國(guó)家免疫規(guī)劃用疫苗項(xiàng)目合作計(jì)劃書
- 中職高考數(shù)學(xué)二輪復(fù)習(xí)專項(xiàng)突破練習(xí)專題38 綜合練習(xí)3(含答案)
- 非洲鼓音樂培訓(xùn)
- 櫻桃派餡料罐頭企業(yè)制定與實(shí)施新質(zhì)生產(chǎn)力戰(zhàn)略研究報(bào)告
- 陀螺、風(fēng)車企業(yè)數(shù)字化轉(zhuǎn)型與智慧升級(jí)戰(zhàn)略研究報(bào)告
- 2025年榆林市公共交通總公司招聘(57人)筆試參考題庫附帶答案詳解
- 醫(yī)院培訓(xùn)課件:《多發(fā)性骨髓瘤》
- 2025年烏海職業(yè)技術(shù)學(xué)院?jiǎn)握新殬I(yè)技能測(cè)試題庫及完整答案一套
- 【新】部編人教版小學(xué)4四年級(jí)《道德與法治》下冊(cè)全冊(cè)教案
- DZ/T 0462.8-2023 礦產(chǎn)資源“三率”指標(biāo)要求 第8部分:硫鐵礦、磷、硼、天然堿、鈉硝石(正式版)
- 部編版三年級(jí)下冊(cè)語文全冊(cè)教案表格版
- 美國(guó)UNF和unc螺紋標(biāo)準(zhǔn)
- 河北省省直行政事業(yè)單位資產(chǎn)(房屋)租賃合同書(共7頁)
- 220kV、110kV設(shè)備基礎(chǔ)施工方案
- 白龍庵隧道出口端仰坡監(jiān)測(cè)專項(xiàng)方案
- 中國(guó)潛水打撈行業(yè)協(xié)會(huì)
評(píng)論
0/150
提交評(píng)論