版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
1、用于指定隨機抽樣的方法,srs表示單純隨機抽樣;“ n=”用于指定抽樣大小(此處可以用抽樣,并指定一些抽樣選項,其中“data= ”指定輸入數(shù)據(jù)集,用于指定抽樣框;“ method=”各種常見隨機化的SAS實現(xiàn)在前兩期的講座中我們介紹了實驗設(shè)計的三要素與四原則1,本期將結(jié)合實例重點闡述實驗設(shè)計中如何實現(xiàn)各種常見的隨機化。隨機化體現(xiàn)在如下三個方面2:抽樣隨機:每一個符合條件的實驗對象參加實驗的機會相同,即總體中每個個體有相同的機會被抽到進入樣本之中。它保證所得到的樣本具有代表性,使實驗結(jié)論具有普遍意義;分組隨機:每個實驗對象分配到不同組 (通常為對照組、不同處理組)的機會相同。它保證大量難以控制
2、的非處理因素在對比組間盡可能均衡一致,以提高各組間的可比性;實驗順序隨機:每個受試對象先后接受處理的機會相等,它使實驗順序的影響也達到均衡。本期主要就如何用SAS實現(xiàn)隨機抽樣和隨機分組進行闡述。已知編號為1-20的20例病人的基本信息見表 1。本文將以表1數(shù)據(jù)為例,闡述隨機化 的SAS實現(xiàn)。表1 20例病人的基本信息病人編號12345678910性別FFMFFFMMMM年齡60643757413160645816病人編號11121314151617181920性別MMFFFFFMFF年齡586323372033394049421.隨機抽樣目前在SAS/STAT模塊中,有一個與調(diào)查設(shè)計有關(guān)的SU
3、RVEYSELECT過程。該過程可用來實現(xiàn)各種隨機抽樣,包括:單純隨機抽樣、系統(tǒng)隨機抽樣、分層抽樣、無限隨機抽樣(有替換)、序貫隨機抽樣、以及按規(guī)模大小成比例概率抽樣(PPS)等。1.1簡單隨機抽樣的實現(xiàn)簡單隨機抽樣,就是從總體中不加任何分組、劃類、排隊等,完全隨機地抽取受試對象。 特點是每個個體(樣品)被抽中的概率相等, 各樣品之間完全獨立,彼此間無一定的關(guān)聯(lián)性 和排斥性。簡單隨機抽樣是其他各種抽樣形式的基礎(chǔ)。通常只是在總體樣品之間差異程度較小和數(shù)目較少時,采用這種方法。例1 :從編號為1到20的人中用簡單隨機化的方法抽取10名作為受試者。用SAS9.1.3實現(xiàn)簡單隨機抽樣的程序如下:dat
4、a a;ods html;in put id sex$ age;proc surveyselect data=acards;method=srs n=10 out=b;1 F 60fun;2 F 64 |proc print data=b;J55run;20 F42|ods html close;run;程序說明:首先,創(chuàng)建 SAS數(shù)據(jù)集名為a。然后,調(diào)用SURVEYSELECT過程進行隨機“rate=”來替換,用于指定抽樣率);“ out=”用于指定輸出數(shù)據(jù)集,它包含所有被抽到的 樣本(可以添加選項“rep= number”來規(guī)定重復(fù)抽樣的次數(shù),如“rep=2”命令系統(tǒng)同時抽取2份樣本)。最
5、后用PROC PRINT把輸出數(shù)據(jù)集b在輸出窗口中顯示出來。 命令ods html 和ods html close用于把程序運行結(jié)果以網(wǎng)頁格式保存下來。輸出結(jié)果如下:Selectio n Method Simple Ran dom Sampli ng TOC o 1-5 h z Input Data SetARan dom Number Seed 937359000Sample Size10Selectio n Probability0.5Sampli ng Weight2Output Data SetB以上是本次單純隨機抽樣的基本信息,抽樣方法是簡單隨機抽樣(Simple RandomSam
6、pling )。由于未指定 SEED=選項來規(guī)定初始種子,來產(chǎn)生隨機數(shù)字流。系統(tǒng)使用默認 種子作為初始種子(SEED=937359000),如果將來想重新抽取與本次完全相同的樣本,可 以在抽樣時指定同一種子。抽取的樣本大小是10。抽樣概率(Selection Probability )是指樣本被抽中的概率,此處為0.5。對于無分層的單純隨機抽樣,樣本的抽樣概率是一致的。抽樣權(quán)重(Sampling Weight)是抽樣概率的倒數(shù),反映樣本信息量的大小。Obsidsexage15F4126F31310M16411M58512M63613F23715F20816F33919F491020F42以上是
7、PROC PRINT命令顯示的輸出數(shù)據(jù)集,包括所有被抽中的樣本。第二列 id顯示 了被抽中的病人的編號。|1.2分層隨機抽樣的實現(xiàn)分層抽樣,先依據(jù)一種或幾種特征將總體分為若干個子總體,每個子總體稱作一個層, 然后從每層中隨機抽取一個子樣本,這些子樣本合起來就是總體的樣本。分層抽樣所得的樣本具有較好的代表性,抽樣誤差較小。例2 :將表1中的20例病人以性別為分層因素,抽取10名受試者。用SAS9.1.3實現(xiàn)分層隨機抽樣的程序如下:ods html;strata sex;proc sort data=a;run;by sex; run;surveyselectdata=a method=srspr
8、oc print data=b; run; | ods html close;n=(6 4) out=b;程序說明:數(shù)據(jù)步與例 1相同,此處省略。過程步,SORT過程用于將數(shù)據(jù)集 a排序,by語句指明按性別進行排序, 此處排序方式為先 F后M。SURVEYSELECT過程與例1的不 同之處在于選項 n=(6 4),規(guī)定每層中得抽樣大小,若每層抽樣大小相同,可寫為門二門!的形式。此外,還多了一個 STRATA語句,該語句用于指定分層變量。1N相繼編號,并計算抽樣距主要SAS輸出結(jié)果如下:離K=N/n。式中N為總體樣品總數(shù),n為樣本容量。然后在1K中抽一隨機數(shù)i,作為樣ObssexidageSel
9、ectionProbSamplingweight1F4570.522F6310.523F13230.524F15200.525F19490.526F20420.527M3370.528M8640.529M11580.5210M18400.521.3系統(tǒng)隨機抽樣的實現(xiàn)系統(tǒng)抽樣,先按照某種順序?qū)⒖傮w中的個體(樣品)從本的第一個被抽樣品,接著取i+K , i+ 2K, , , i+(n-1)K,直至抽夠n個樣品為止。值得注意的是,當總體的被觀察樣品按順序有周期趨勢或增加(減少)趨勢時,容易產(chǎn)生偏倚。例3:將表1中的20例病人按系統(tǒng)隨機抽樣的方法抽取5名受試者。用SAS9.1.3實現(xiàn)系統(tǒng)隨機抽樣的程序
10、如下:ods html;run;proc surveyselectdata=a method=sysproc print data=b;n=5 out=b;run;con trol id;ods html close;程序說明:數(shù)據(jù)步與例1相冋,此處省略。SURVEYSELECT過程與例1的不冋之處在于選項method=sys,規(guī)定抽樣方法為系統(tǒng)隨機抽樣法。此外,還多了一個control語句,該語句用于指定排序的變量。SAS輸出結(jié)果如下: TOC o 1-5 h z ObssexageidF574Ml648M6312F3316F 42201.4整群抽樣的實現(xiàn)整群抽樣是先將總體分成若干群,從中隨
11、機抽取幾個群;抽中群內(nèi)的全部個體(樣品) 組成樣本??蓪⒄撼闃愚D(zhuǎn)化為簡單隨機抽樣。例如,從10班隨機抽取5個班作為受試對象,可看做從10個個體中隨機抽取 5個,即為簡單隨機抽樣。2.隨機分組利用SAS軟件實現(xiàn)隨機分組的途徑有很多,目前比較常用的是 SAS/STAT模塊的PLAN過程,它可用于構(gòu)建各種常見的試驗設(shè)計并對設(shè)計方案進行隨機化,也可用于產(chǎn)生數(shù)字的排列組合表。筆者將介紹如何利用PLAN過程來實現(xiàn)兩組和多組的隨機分組。2.1完全隨機化的實現(xiàn)完全隨機化,直接對受試對象進行隨機化分組, 常通過擲硬幣或隨機數(shù)字表, 或用計算 機產(chǎn)生隨機數(shù)來進行隨機化,在事先或者實施過程中不作任何限制和干預(yù)或調(diào)
12、整。分組后各組受試對象的例數(shù)不一定相等。例4 :將表1中的20例病人隨機分為2組。data e;/*第四步 */set c;group2=group;patie nt2=patie nt;keep group2 patie nt2;run;data f;/*第五步 */merge d e;run;ods html; |proc print noobs; /*第六步 */run;ods html close;用SAS9.1.3實現(xiàn)簡單隨機分組的程序如下:output out=sheji;run;data b c;/*第二步 */set sheji;patie nt=_n_;factors a=2
13、0;proc plan seed=20101216; /*第一步 */if a=10 the n do; group=A:output b; end;else do; group=B;output c;end;run;data d;/*第三步 */set b; |group仁group;patie nt1=patie nt;keep group1 patie nt1;run;程序說明:第一步,調(diào)用PLAN過程產(chǎn)生20個隨機排列數(shù),并把結(jié)果輸出至數(shù)據(jù)集sheji中,選項seed=,規(guī)定產(chǎn)生隨機數(shù)的種子。第二步,對數(shù)據(jù)集sheji進行操作,把病人按隨機排列數(shù)進行分組,隨機數(shù)小于等于10的進入A組,
14、其余進入B組,并將結(jié)果分別保存至數(shù)據(jù)集b和c中。第三步和第四步,分別將數(shù)據(jù)集b、c中的group改為group1、group2,將patient改為patient1和patient2,生成新的數(shù)據(jù)集 d和e。最后把數(shù)據(jù)集d和e合并為新的數(shù) 據(jù)集f ,并通過PRINT過程將隨機分組的結(jié)果展現(xiàn)出來。SAS輸出結(jié)果如下:grouplpatientlgroup2patient2A4B1A5B2A7B3A8B6grouplpatientlgroup2patient2A10B9A11B14A12B15A13B16A17B18A19B20例5將這20例病人隨機分為4組。用SAS9.1.3實現(xiàn)簡單隨機分組的程
15、序如下3proc plan seed=20101216;factors a=20;output out=sheji;run;data b1 b2 b3 b4;|set sheji;patie nt=n;if a=5 then do; group=A; output b1; end;if 6=a=10 the n do; group=B;output b2; end;if 11=a=15 then do; group=C;output b3; end;if 16=a then do;group=D; output b4;e nd;run;data d1;set b1;group仁group;pa
16、tie nt仁patie nt;keep group1 patie nt1;data d3;set b3; group3=group;patie nt3=patie nt;keep group3 patie nt3; run;data d4;set b4;group4=group;patie nt4=patie nt;keep group4 patie nt4; run;data f;merge d1 d2 d3 d4; run;ods html; | proc print no obs; run;ods html close;(如年齡、性別、病情、run;grouplpatientlgrou
17、p2patient2group3patient3group4patient4A5B4C1D2A7B8C6D3A10B11C9D14A13B12C15D18A19B17C16D20SAS輸出結(jié)果如下:2.2分層隨機化的實現(xiàn)分層隨機化,首先對可能影響實驗過程和結(jié)果的主要混雜因素疾病分期等)進行分層,然后在每一層內(nèi)進行完全隨機化分組,最后分別合并為實驗組和對 照組。配對隨機化和區(qū)組隨機化可看成是分層隨機化的實際應(yīng)用。例6將表1中的20例病人以性別為區(qū)組因素,隨機分為2組。將20例病人中的12名女性,編號為1-12,按例4中的程序分為2組;8名為男性,編 號為1-8,按例4中的程序分為2組,可以實現(xiàn)對
18、這 20例病人的區(qū)組隨機化。例7現(xiàn)有來自3個窩別的24只大鼠,以窩別為區(qū)組因素,隨機為4組,每組6只。對大鼠進行編號,第一窩編號為用SAS9.1.3實現(xiàn)區(qū)組隨機化的程序如下 proc plan seed=201200505;factors block=3 len gth=8; output out=sheji; |run;data a b c d; set sheji; mouse= n; if len gth=2 the n do;group=A;output a;e nd; else if 3=le ngth=4 the n do;group=B;output b;e nd; else i
19、f 5=le ngth=6 the n do;group=C;output c;end; else do;group=D;output d;e nd; run;data aa;set a; | group仁group; mouse仁mouse;keep group1 mouse1;run;8,第二窩編號為 916,第三窩編號為1724。3 , 4data bb;set b;group2=group;mouse2=mouse;keep group2 mouse2;run;data cc;set c;group3=group;mouse3=mouse; keep group3 mouse3;run;data dd;set d;group4=group;mouse4=mouse;keep group4 mouse4;run;data e;merge aa bb cc dd;run;ods htm
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- ICT項目施工高質(zhì)量保障要求措施
- 現(xiàn)場施工項目部晨會制度流程
- 混凝土工程施工方案與技術(shù)措施
- 股東退股協(xié)議書范文
- 影響施工質(zhì)量的因素分析及相關(guān)措施
- 合同協(xié)議書格式范文
- 夏季高溫施工防暑降溫預(yù)防措施
- 工程施工人員培訓(xùn)計劃
- 料瓶聯(lián)合經(jīng)營合同
- 大型展會搭建穿插施工方案
- 2024年天津市中考英語試題卷(含答案)
- 2024-2034年中國皮帶輸送機托輥行業(yè)發(fā)展趨勢及投資前景預(yù)測報告
- FZ∕T 73037-2019 針織運動襪行業(yè)標準
- (圖文并茂)綠化工程施工組織設(shè)計
- MOOC 生物醫(yī)學(xué)傳感器與測量-山東大學(xué) 中國大學(xué)慕課答案
- 上海市民辦華育中學(xué)2022-2023學(xué)年六年級上學(xué)期期末科學(xué)試卷
- 導(dǎo)診服務(wù)意識課件培訓(xùn)總結(jié)
- 成人用品行業(yè)分析
- 幼兒園領(lǐng)域課程指導(dǎo)叢書:幼兒園美術(shù)領(lǐng)域教育精要關(guān)鍵經(jīng)驗與
- 投標人資格審查表(范本)
- eva乳液工藝流程
評論
0/150
提交評論