SPSS中隨機(jī)抽樣的精確實(shí)現(xiàn)

上傳人：7*** IP屬地：湖北上傳時(shí)間：2022-03-04 格式：DOC 頁(yè)數(shù)：7 大小：18.50KB 積分：18 舉報(bào) 版權(quán)申訴

已閱讀5頁(yè)，還剩2頁(yè)未讀，繼續(xù)免費(fèi)閱讀

版權(quán)說明：本文檔由用戶提供并上傳，收益歸屬內(nèi)容提供方，若內(nèi)容存在侵權(quán)，請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、計(jì)算機(jī)應(yīng)用SPSS中隨機(jī)抽樣的精確實(shí)現(xiàn)南方醫(yī)科大學(xué)珠江醫(yī)院信息科(510282中山大學(xué)公共衛(wèi)生學(xué)院統(tǒng)計(jì)與流行病學(xué)系(510080顏杰謝薇方積乾SPSS在菜單中僅提供了兩種從數(shù)據(jù)表中隨機(jī)抽取記錄的功能。一種是近似法,即由用戶指定抽取比例,系統(tǒng)按該比例在全部記錄中進(jìn)行無返回的抽樣。此時(shí)系統(tǒng)對(duì)于每條記錄都是用獨(dú)立的偽隨機(jī)數(shù)發(fā)生器進(jìn)行抽樣,故抽樣結(jié)果只能近似符合指定的比例。根據(jù)大樣本代表性好的原理,數(shù)據(jù)文件中的記錄條數(shù)越多,比例越接近50%,結(jié)果就會(huì)越接近。另外一種方法是精確法,由用戶指定需抽取的記錄條數(shù)和從前面多少條記錄中抽取,系統(tǒng)就從指定的范圍內(nèi)抽取相應(yīng)條記錄。以上兩種方法的局限就是無法根據(jù)用戶的

2、需要,在任意指定抽取范圍進(jìn)行精確抽樣。前者只能進(jìn)行近似抽樣,而后一種方法又不能任意指定抽取范圍,應(yīng)用起來不方便。我們?cè)趯?shí)際應(yīng)用過程中,發(fā)現(xiàn)借助SPSS對(duì)話框中的Paste按鈕,利用SPSS的程序編輯窗口對(duì)抽樣程序作一些修改就可以實(shí)現(xiàn)任意指定范圍的抽樣。具體方法如下:假定當(dāng)前數(shù)據(jù)文件中有2000條記錄,分為2個(gè)組,11000條為A組,10012000條為B組?，F(xiàn)分別要從2組中各隨機(jī)抽取50條記錄。首先實(shí)現(xiàn)從第1組中抽樣,此時(shí)直接利用SPSS 就可實(shí)現(xiàn)。在菜單中選擇DataSelect Cases,在彈出的Select Cases對(duì)話框中選擇Random Sample of cases 選項(xiàng),又彈

3、出Select Cases:Random Sample對(duì)話框,其中第1選項(xiàng)是按比例近似抽樣,第2選項(xiàng)就是指定范圍精確抽樣。選中第2選項(xiàng),在相應(yīng)的框中分別填入50和1000(見圖1。圖1Select Cases:Random Sample對(duì)話框然后點(diǎn)擊Continue按鈕返回Select Cases對(duì)話框,再點(diǎn)擊框中的Paste按鈕,系統(tǒng)自動(dòng)打開程序編輯窗口,并將上述過程翻譯為相應(yīng)SPSS程序。程序語句內(nèi)容如下:01USE ALL.02do if$casenum= 1.03compute#s-$-1=50.04compute#s-$-2=1000.05end if.06do if#s-$-2&g

4、t;0.07compute filter-$=uniform(13#s-$-2<#s-$-1.08compute#s-$-1=#s-$-1-filter-$.09compute#s-$-2=#s-$-2- 1.10else.11compute filter-$=0.12end if.13VARIABL E LABEL filter-$.50from the first1000cases (SAMPL E14FORMAT filter-$(f110.15FIL TER B Y filter-$.16EXECU TE.上段程序中使用了臨時(shí)變量(scratch variable# s-$-1和

5、#s-$-2,這種變量常被用作循環(huán)指針。這里也是利用它們實(shí)現(xiàn)條件循環(huán)。程序的基本流程是,首先指定需要抽取的初始記錄條數(shù)#s-$-1和初始可抽取范圍內(nèi)記錄條數(shù)#s-$-2(1#s-$-2,這就決定了抽樣比例(#s-$-1/#s-$-2,即每條記錄被抽中的可能性為#s-$-1/#s-$-2。然后通過控制#s-$-1和#s-$-2的變化來實(shí)現(xiàn)抽樣。具體抽樣由07行語句compute filter-$=uniform (13#s-$-2<#s-$-1完成,其中uniform(1是SPSS中提供的偽隨機(jī)數(shù)函數(shù),它可產(chǎn)生一個(gè)服從0 1均勻分布的隨機(jī)數(shù),統(tǒng)計(jì)中常用此函數(shù)模擬隨機(jī)抽樣。將該語句變換成co

6、mpute filter-$=uniform (13<#s-$-1/#s-$-2,就很容易理解了,它就是按#s-$-1/#s-$-2的可能性隨機(jī)決定當(dāng)前記錄是否被抽中。若抽中則篩選指示變量filter-$賦值為1,同時(shí)#s-$-1減1表示剩下還需抽取記錄數(shù);否則為0。此后#s-$-2減1表示剩下的可抽取記錄數(shù)。這樣反復(fù)直到#s-$-2=0表示所有范圍內(nèi)的記錄都判定完了。程序的巧妙之處是利用可變的# s-$-1/#s-$-2實(shí)現(xiàn)精確抽樣,其作用類似于一個(gè)杠桿,當(dāng)抽滿時(shí),#s-$-1=0,compute filter-$=552中國(guó)衛(wèi)生統(tǒng)計(jì)2005年8月第22卷第4期uniform(13&l

7、t;0就控制剩下的記錄都不會(huì)被抽中;若#s-$-1=#s-$-2,則表示還需抽取的記錄數(shù)就是剩下的記錄數(shù),compute filter-$=uniform(1 3<1就控制剩下的記錄都被抽中。明白了程序的原理后就很容易修改了?，F(xiàn)在我們來實(shí)現(xiàn)從10012000條中抽取50條,這時(shí)只需要對(duì)程序作如下改動(dòng):11將02行語句中的臨時(shí)變量$casenum賦值為1001,即指定抽取范圍的起始值;21在02行語句后增加一條語句:compute#s-$-3=$casenum1,新增加臨時(shí)變量#s-$-3來控制范圍起始值的變化,而用臨時(shí)變量#s-$-2表示范圍結(jié)束值,則抽取范圍內(nèi)記錄條數(shù)變?yōu)?s-$-2-

8、# s-$-3+1;31將07行和08行語句中#s-$-2改為#s-$-2-#s-$-3+1。整個(gè)修改后程序如下: USE ALL.do if$casenum=1001.compute#s-$-1=50.compute#s-$-2=2000.compute#s-$-3=$casenum.end if.do if#s-$-2-#s-$-3+1>0.compute filter-$=uniform(13(#s-$-2-#s-$-3+1 <#s-$-1.compute#s-$-1=#s-$-1-filter-$compute#s-$-3=#s-$-3+1.pute fil

9、ter-$=0.end if.VARIABL E LABEL filter-$50from the first1000cases(SAM2 PL E.FORMAT filter-$(f110.FIL TER B Y filter-$.EXECU TE.運(yùn)行上述程序就可以實(shí)現(xiàn)在10012000條記錄中抽取50條記錄了。具體操作方法是:在程序編輯窗口的菜單中選擇RunAll,程序就會(huì)運(yùn)行,系統(tǒng)會(huì)在數(shù)據(jù)集中生成篩選指示變量filter-$,并且在相應(yīng)的記錄號(hào)上加斜杠表示未選中。在實(shí)際應(yīng)用中,可根據(jù)需要重新定義變量$casenum(起始記錄值、#s-$-1(需抽取記錄條數(shù)和#s-$-2(結(jié)束記錄值,就

10、可以實(shí)現(xiàn)任意范圍內(nèi)的精確抽樣了。該算法具有普適性,如果將其寫成SAS語言,也就可以在SAS中實(shí)現(xiàn)任意范圍的精確抽樣。SPSS是國(guó)際通用的統(tǒng)計(jì)軟件包,一般應(yīng)用時(shí)都強(qiáng)調(diào)它的菜單式的操作界面友好,因此被譽(yù)為“非統(tǒng)計(jì)專業(yè)人士的首選軟件”。其實(shí)它的編程功能也很強(qiáng)大,對(duì)菜單功能是一個(gè)極好的補(bǔ)充。尤其是系統(tǒng)在對(duì)話框中都提供Paste按鈕,大大簡(jiǎn)化了編程工作,在此基礎(chǔ)上對(duì)程序作一些改動(dòng),就可以根據(jù)自己的需要實(shí)現(xiàn)許多菜單方式完成不了的功能。(上接第244頁(yè)V2=-01150y1-01026y2-01038y3+01311y4+ 01309y5+01351y6+01046y7+01306y8W2=01120x1+

11、01201x2-01194x3+ 01256x4-01018x5-01079x6-01507x7+01542x8+01082x9+01317x10可利用典則變量這一綜合指標(biāo)代替原來的多變量信息。從標(biāo)準(zhǔn)化指標(biāo)線性組合的系數(shù)可了解各指標(biāo)對(duì)典則變量的影響大小,系數(shù)絕對(duì)值越大,影響越大,對(duì)應(yīng)的變量即為該典則變量的的主要變量,以此可找出各指標(biāo)組中的主要指標(biāo)。標(biāo)準(zhǔn)系數(shù)的正、負(fù)符號(hào)不同,表明影響的方向不同。分析表明反映生命質(zhì)量的第一典則變量V1主要反映活力(y6、社會(huì)功能(y4及精神健康(y5,第二典則變量V2主要反映活力(y6、社會(huì)功能(y4、精神健康(y5及總體健康(y8。反映健康觀的第一典則變量W1主

12、要反映睡眠質(zhì)量(x6、煩惱事件(x7及生活態(tài)度(x3,第二典則變量W2主要反映解壓能力(x8、煩惱事件(x7及飲食習(xí)慣(x10。討論本研究分析結(jié)果表明,生命質(zhì)量和健康觀兩者之間存在正相關(guān)關(guān)系。生命質(zhì)量的高低主要由活力、社會(huì)功能及精神健康來體現(xiàn),而健康觀主要由睡眠質(zhì)量及解壓能力來反映。生命質(zhì)量和健康觀的相關(guān)主要是第一對(duì)典則變量V1和W1的相關(guān),而V1主要由y6、y4及y5決定,W1主要由x6決定,所以主要是活力、社會(huì)功能及精神健康和睡眠的正相關(guān),即良好的睡眠使人充滿活力并有良好的社會(huì)交往能力及精神健康。第二對(duì)典則變量主要是活力、社會(huì)功能、精神健康及總體健康和解壓能力的正相關(guān),即良好的解壓能力使人充滿

人人文庫(kù)> 全部分類> 教育資料 > 輔導(dǎo)培訓(xùn)

溫馨提示

1. 本站所有資源如無特殊說明，都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
2. 本站的文檔不包含任何第三方提供的附件圖紙等，如果需要附件，請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
3. 本站RAR壓縮包中若帶圖紙，網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽，若沒有圖紙預(yù)覽就沒有圖紙。
4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間，僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理，對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯，并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容，請(qǐng)與我們聯(lián)系，我們立即糾正。
7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

SPSS中隨機(jī)抽樣的精確實(shí)現(xiàn)

文檔簡(jiǎn)介

溫馨提示

最新文檔

評(píng)論

SPSS中隨機(jī)抽樣的精確實(shí)現(xiàn)

文檔簡(jiǎn)介

溫馨提示

最新文檔

評(píng)論

相關(guān)文檔