




版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領
文檔簡介
1、.實驗一 描述性分析實驗二 正態(tài)總體的均值檢驗實驗三 非參數(shù)檢驗實驗四 方差分析實驗五 回歸分析實驗六 判別、聚類分析實驗七 主成分分析實驗八 因子分析實驗一 描述性分析【實驗目的】1. 2. 【實驗原理】數(shù)據(jù)分析是指用適當?shù)慕y(tǒng)計方法對收集來的大量第一手資料和第二手資料用信息和形成結(jié)論而對數(shù)據(jù)加以詳細研究和概括總結(jié)的過程。要特征,也就是說,要研究數(shù)據(jù)的數(shù)字特征。對于數(shù)據(jù)的數(shù)字特征,要分析數(shù)據(jù)的集中位置、分散程度。數(shù)據(jù)的分布是正態(tài)的還是偏態(tài)等。對于多元數(shù)據(jù),還要分析多元數(shù)據(jù)的各個分量之間的相關性等。.頁腳.【實驗項目設計】1. 給定一組單變量數(shù)據(jù),分組計算均值、方差、Q1、Q3、偏度、峰度。給定
2、一組多變量數(shù)據(jù),計算相關矩陣。2.【實驗內(nèi)容】一、單樣本的數(shù)字特征計算(習題1.4) 從某商店的營業(yè)日中隨機抽取1212.5, 17.2, 9.1, 25.4, 31.2, 20, 18.9, 22.8, 21.1, 17.8, 25.1, 27.7試求樣本均值、樣本方差、樣本變異系數(shù)、樣本中位數(shù)、上樣本四分位數(shù)、下樣本四分位數(shù)、樣本四分位數(shù)間距和極差。1. 建數(shù)據(jù)集Data d4;Input x;Cards;12.5 17.2 9.1 25.4 31.2 20 18.9 22.8 21.1 17.8 25.1 27.7;Run;2. 使用“SAS/ 分析家”菜單(1)打開“分析家”界面。選擇
3、SAS界面的級聯(lián)菜單:“解決方案”“分析”“分析家”。(2)調(diào)出數(shù)據(jù)文件 Work.D4 。在界面的空白處,右鍵彈出菜單,選擇級聯(lián)菜單:“文件”“按 SAS 名稱打開”。依次選擇邏輯庫和文件對象,分別為“Work”、“D4”,單擊“確定”按鈕。.頁腳.(3)確定分析方法。選擇界面上的級聯(lián)菜單:“統(tǒng)計”“描述性統(tǒng)計”“分布”(4)輸送變量。首先選中變量“x”,然后單擊“Analyst”按鈕。即完成變量的輸送,確定變量“x”作為分析變量。單擊“OK”。(5)得到輸出結(jié)果.頁腳.上述使用“分析家”的調(diào)用過程等價于程序調(diào)用 univariate 過程:proc univariate data=d4;V
4、ar x;Run;3. 解答.頁腳.樣本均值 mean =樣本方差 Variance =樣本變異系數(shù) Coeff Variation =樣本上四分位數(shù) 75% Q3=樣本中位數(shù) Median =樣本下四分位數(shù)25% Q1=極差Range =樣本四分位數(shù)間距 Interquartile Range =二、相關矩陣計算 3.2.3) 今對31個人進行人體測試,考察或測試的七個指標是:年齡(x1)、英里跑的時間(x4)、休息時的脈搏(x5)、跑步時的脈搏(x6)和跑步時記錄的最大脈搏(x7)。數(shù)據(jù)列于表3.2.1。現(xiàn)欲對這些指標作一些相關分析。1. 對于給定 EXCEL 數(shù)據(jù)文件,導入數(shù)據(jù)建數(shù)據(jù)集
5、e323.sas7bdat2. 使用 SAS/INSIGHT 菜單3. 輸出單變量統(tǒng)計量變量N均值標準偏差最小值最大值x1x2x3x4x5x6x73131313131313147.677477.444547.375810.586153.7419169.6452173.77425.21148.32865.32721.38748.294410.25209.164138.000059.080037.38808.170040.0000146.0000155.0000 =x4x1 1.0000 -0.2335 -0.3046 0.1887 -0.3379 -0.4329x2 1.0000 -0.1628
6、 0.1435 0.0227 0.1815 0.2494x3 -0.1628 1.0000 -0.8622 -0.3980 -0.2367x4 0.1887 0.1435 -0.8622 1.0000 0.4005 0.3136 0.2261x5 0.0227 -0.3464 0.4005 1.0000 0.3180 0.2575x6 0.1815 -0.3980 0.3136 0.3180 1.0000 0.9298x7 0.2494 -0.2367 0.2261 0.2575 0.9298 1.0000偏協(xié)方差矩陣, 自由度 = 27x4x5x6x7x4x5x6x70.53501.0135
7、-1.0662-0.25341.013561.06554.89063.7683-1.06624.890671.062060.7096-0.25343.768360.709661.5501.頁腳.實驗二 正態(tài)總體的均值檢驗【實驗目的】1. 2. 【實驗原理】1 單樣本總體均值的 t 檢驗 H0: 0 x t t n10統(tǒng)計量:t 0Hsn 拒絕域:t t n122兩獨立組樣本總體的方差比較 H0: 12s1s22統(tǒng)計量:F F F n 1,n 1 H0:12122拒絕域:F F n 1,n 1 ,F Fn 1,n 1 ,1221212【實驗項目設計】1. 單個正態(tài)總體的均值檢驗;2. 兩獨立組樣
8、本(服從正態(tài)總體)進行均值比較檢驗;3. 兩對照組樣本(服從正態(tài)總體)進行均值比較檢驗。【實驗內(nèi)容】一、單個正態(tài)總體的均值檢驗習題 1.4) 從某商店的營業(yè)日中隨機抽取 12.頁腳.12.5, 17.2, 9.1, 25.4, 31.2, 20, 18.9, 22.8, 21.1, 17.8, 25.1, 27.7試檢驗: =10 。1. 建數(shù)據(jù)集Data d4;Input x;Cards;12.5 17.2 9.1 25.4 31.2 20 18.9 22.8 21.1 17.8 25.1 27.7;Run;2. 使用“SAS/ 分析家”菜單(1)打開“分析家”界面。(2)調(diào)出數(shù)據(jù)文件 Wo
9、rk.D4 。(3)確定分析方法。選擇界面上的級聯(lián)菜單:“統(tǒng)計”“假設檢驗”“均值的單樣本T檢驗”(4)輸送變量。確定變量“x”為分析變量。(5)得到輸出結(jié)果.頁腳.3. 解答H0: H1: 010檢驗方法:t檢驗統(tǒng)計量取值:t=_檢驗p值=_結(jié)論:拒絕/接受H0.二、兩獨立組樣本(服從正態(tài)總體)進行均值比較(習題1.22) 為比較甲、乙兩種安眠藥的療效,將20名患者分成兩組,每組10下:1.9, 0.8, 1.1, 0.1, -0.1, 4.4, 5.5, 1.6, 4.6, 3.40.7, -1.6, -0.2, -1.2, -0.1, 3.4, 3.7, 0.8, 0, 2試問在顯著性水
10、平a=0.05下檢驗兩種安眠藥的療效有無顯著性差異,p值是多少?1. 建數(shù)據(jù)集前面的“分析家”界面不要關閉,切換到程序編輯窗口,輸入程序。Data d22;Input x y;Cards;1.9 0.70.8 -1.61.1 -0.20.1 -1.2-0.1 -0.14.4 3.45.5 3.71.6 0.84.6 03.4 2;Run;2. 使用“SAS/分析家”菜單(1)回到“分析家”界面,調(diào)出數(shù)據(jù)文件 work.d22(2)確定分析方法。選擇級聯(lián)菜單:“統(tǒng)計”“假設檢驗”“均值的雙樣本T檢驗”.頁腳.(3)設置數(shù)據(jù)集 work.d22 中,各樣本分組數(shù)據(jù)對應的變量個數(shù):“Twovaria
11、bles” 。(4)輸送變量。將變量“x”輸送給 “group1”,“y”輸送給 “group2”,單擊“OK”(5)輸出結(jié)果如下.頁腳.(6)涉及到兩獨立組的方差,繼續(xù)檢驗兩組方差是否相等?;氐健胺治黾摇苯缑嫔?,選擇級聯(lián)菜單“統(tǒng)計”“假設檢驗”“方差的雙樣本 T 檢驗”(7)輸送變量。將變量“x”輸送給 “group1”,“y”輸送給 “group2”,單擊“OK”。(8)輸出結(jié)果如下3. 解答H0: 1=2H1: 12檢驗方法:F 檢驗.頁腳.統(tǒng)計量取值:F=_檢驗p值=_結(jié)論:拒絕/接受H0.兩獨立組的方差是/否相等。H0: 1=2H1: 12檢驗方法:t檢驗統(tǒng)計量取值: t=_檢驗p值
12、=_結(jié)論:拒絕/接受H0. 兩種安眠藥的療效有/無顯著性差異三、兩對照組樣本(服從正態(tài)總體)進行均值比較(習題1.24) 甲、乙兩種稻種分別播種在10種各種一半。假設同一塊田中兩種作物的產(chǎn)量之差服從正態(tài)分布。現(xiàn)獲10塊田的成對產(chǎn)量如下表所示(單位:公斤),試問兩種稻種產(chǎn)量有無顯著性差異(a=0.05),p值是多少?610甲種 140 137 136 140 145 148 140 135 144 141乙種 135 138 125 140 128 131 130 140 131 1251. 建數(shù)據(jù)集Data d24;Input x y ;Cards;140 135148 131;137 138
13、140 130136 125135 140140 140144 131145 128141 125Run;2. 使用“SAS/分析家”菜單(1)回到“分析家”界面,調(diào)出數(shù)據(jù)文件 work.d24(2)確定分析方法。選擇級聯(lián)菜單:“統(tǒng)計”“假設檢驗”“均值的雙樣本成對T檢驗”.頁腳.(3)輸送變量。 得到輸出結(jié)果如下:3. 解答H0: 1=2H1: 12檢驗方法:t檢驗統(tǒng)計量取值:t=_檢驗p值=_結(jié)論:拒絕/接受H0,兩種稻種產(chǎn)量有/無顯著性差異.實驗三 非參數(shù)檢驗【實驗目的】1. 2. 熟悉符合檢驗、符號秩和檢驗、秩和檢驗。【實驗原理】.頁腳.展遠遠不及參數(shù)檢驗完善,因而比較完善的可供使用的
14、方法也不多。在SAS中,非參數(shù)統(tǒng)計主要由UNIVARIATE過程和NPAR1WAY過程來實現(xiàn),使用SAS的“分析家”系統(tǒng)可以方便地進行界面操作。【實驗項目設計】1. 對列聯(lián)表,檢驗行變量與列變量的關聯(lián)性;2. 給定一組未知總體的樣本數(shù)據(jù),檢驗=0;給定兩組未知總體的樣本數(shù)據(jù),檢驗1=2?!緦嶒瀮?nèi)容】一、對列聯(lián)表,檢驗行變量與列變量的關聯(lián)性(習題4.7) 下表為某藥治療感冒效果的3x3列表。療效年齡 兒童 成年 老年 合計顯著 58一般 28較差 23合計 1093832451491128117554418100300試問:療效與年齡是否關聯(lián)(a=0.05)?1. 建數(shù)據(jù)集 effect=, 較
15、差; age=成年老年; output;end;end;Cards; ;.頁腳.2. 使用“SAS/ 分析家”菜單(6)打開“分析家”界面。(7)調(diào)出數(shù)據(jù)文件 Work.D0407。(8)確定分析方法。選擇界面上的級聯(lián)菜單:“統(tǒng)計” “表分析”得到列聯(lián)表的空白界面。(9)輸送變量。量“num”,單擊“CellCounts”按鈕。完成變量輸送。顯示如下。(10)選擇附加的統(tǒng)計方法。在列聯(lián)表分析(Table Analysis)界面的右邊下角,點擊“statistics”按鈕,打開選項設置頁。勾選“chi-squarestatistics”。如圖所示。單擊“OK”按鈕。.頁腳.勾選中間的“Exact
16、test”選項卡,來指定精確檢驗,只是某些時候的運行時間無法控制。(11)得到輸出結(jié)果3. 解答H0:療效與年齡獨立。 4檢驗統(tǒng)計量及其分布: :22.頁腳.統(tǒng)計量=檢驗p值=結(jié)論:二、對未知總體的一組樣本數(shù)據(jù),進行均值的非參數(shù)檢驗 (H0:=0)(習題 4.9 ) 從某企業(yè)中隨機抽取12位:萬元):5.42 5.65 5.645.134.695.134.814.375.826.314.78 5.52試用符號檢驗對該企業(yè)職工年收入的中位數(shù)是否顯著超過了 5 萬元進行符號檢驗(a=0.05)。1. 建數(shù)據(jù)集前面的“分析家”界面不要關閉,切換到程序窗口,運行以下程序。Data d0409;inpu
17、tincome ;d =income -5;cards;5.424.815.654.375.645.825.136.314.694.785.135.52;2. 使用“SAS/ 分析家”菜單(1)在未關閉的“分析家”界面中,調(diào)出數(shù)據(jù)文件 Work.D0409。(2)打開對應于univariate程序功能的菜單分析界面。選擇界面上的級聯(lián)菜單:“統(tǒng)計”“描述性統(tǒng)計”“分布”(3)輸送差值變量“d”。選中差值變量“d”,單擊Analysis框。單擊“OK”。(4)得到輸出結(jié)果。.頁腳.3. 解答H0:m=5 H1:m5符號檢驗檢驗統(tǒng)計量及其分布:s :b 0.5統(tǒng)計量 s+= 2+=8檢驗p值=0.3
18、877 /2=0.194 (單邊檢驗,故概率除以2)結(jié)論:接受H0。符號秩檢驗(前提:假定總體的分布式對稱的)檢驗統(tǒng)計量T代表差值變量d中取值為正的數(shù)據(jù)項秩總和。統(tǒng)計量 T+= 19 + E(T+)=19 +12(12+1)/4 =19 +39 =58,檢驗p值=0.1455/2=0.073(單邊檢驗,故概率除以2)結(jié)論:接受H0。三、兩組未知總體的樣本數(shù)據(jù),非參數(shù)檢驗總體均值 甲乙1. 建數(shù)據(jù)集前面的“分析家”界面不要關閉,切換到程序窗口,運行以下程序。datad04012;inputx class $;cards;8.635 甲9.071 甲9.231 甲8.797 甲.頁腳.甲10.32
19、5 甲7.342 乙7.436 乙乙8.946 乙9.131 乙6.823 乙8.965 乙8.696 乙8.345 乙;運行 npar1way 過程proc npar1way data=d04012 wilcoxon;class c;var x;3. 得到輸出結(jié)果4. 解答H0:兩臺機器沒有顯著的差異(即1=2) 12)T=67,(統(tǒng)計量 T代表甲臺機器的樣本數(shù)據(jù)在混合數(shù)據(jù)中的秩和),檢驗p值=0.0292 (雙邊檢驗,故選用z檢驗的 “Twosided Pr |Z| ”),拒絕H0,認為兩臺機器存在顯著差異。.頁腳.【思考題】問題1說出非參數(shù)檢驗和參數(shù)檢驗的區(qū)別。問題2說出非參數(shù)檢驗中,都
20、有哪幾類問題有需要以引入差值變量實驗四 方差分析【實驗目的】3. 4. 【實驗原理】方差分析(analysis of variance,簡稱ANOVA)是用來對多個總體的均值作比總體均值有無顯著差異的問題稱為多重比較問題。常用的有費希爾LSD法和邦弗倫尼法。【實驗項目設計】1. 進行單變量方差分析;2.考慮交互作用進行雙方差分析;3.不考慮交互作用進行方差分析?!緦嶒瀮?nèi)容】一、單因素方差分析&多重比較 所 需 時 間甲 .頁腳.乙丙 ()例 試給出方差分析表(參考教材124頁)1. 建數(shù)據(jù)集/* 引入變量a和數(shù)值變量x,建數(shù)據(jù)集c0501 */Data c0501;inputx ;if _n_
21、 7then a=甲;else if _n_ 2,結(jié)束答題;如果 m=2,繼續(xù)完成下面的題目。8. 根據(jù)前兩個潛因子的載荷系數(shù)列(ai1*),(ai2*),畫出類似 323 頁的散點圖。9. 根據(jù)輸出數(shù)據(jù)集,畫出類似 331 頁的因子得分散點圖。10. 根據(jù)第 9 問圖形,你可以得出什么結(jié)論?三、參考答案實驗程序:data sasuser.bexec11c2 ;input no x1x2x3x4x5;datalines;1 5700 12.82 1000 10.93 3400 8.84 3800 13.65 4000 12.86 8200 8.37 1200 11.48 9100 11.59
22、9900 12.510 960013.72500 270 25000600 10 100001000 10 90001700 140 250001600 140 250002600 60 1200040010 160003300 60 140003400 180 180003600 390 250003300 80 120004000 100 1300011 96009.612 940011.4.頁腳.;proc factor simple corr;proc factor data=sasuser.bexec11c2 n=2 rotate=varimax out=out11c2;var x1-x5;proc factor data=sasuser.bexec11c2 n=2 =ml heywood rotate=varimax;var x1
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 個人辦公用品采購合同規(guī)范
- 數(shù)字化圖書館建設協(xié)議
- 中醫(yī)藥兒童知識培訓課件
- 馬匹買賣合同
- 豬場生產(chǎn)技術服務協(xié)議
- 汽車技術維護與管理考試題及詳解
- 產(chǎn)品召回與處理協(xié)議
- 雕塑制作合同協(xié)議書
- 電子商務平臺使用授權及運營協(xié)議
- 企業(yè)級云計算解決方案服務合同
- 2025年城市現(xiàn)代化策劃合同范本
- 2025年安徽水利水電職業(yè)技術學院單招綜合素質(zhì)考試題庫及完整答案一套
- 2025年皖西衛(wèi)生職業(yè)學院單招職業(yè)適應性測試題庫一套
- 踝關節(jié)骨折中醫(yī)護理方案
- 2025年黑龍江省伊春市單招職業(yè)適應性測試題庫含答案
- 8.3 摩擦力(課件)2024-2025學年人教版八年級物理下冊
- 2025年黑龍江職業(yè)學院單招職業(yè)適應性測試題庫帶答案
- 第五章產(chǎn)前檢查及高危妊娠監(jiān)測課件
- 環(huán)水保培訓資料
- 2025中智集團招聘重要崗位高頻重點模擬試卷提升(共500題附帶答案詳解)
- 2025年第六屆美麗中國全國國家版圖知識競賽題庫及答案
評論
0/150
提交評論