SPSS軟件數(shù)據(jù)處理與管理PPT課件_第1頁
SPSS軟件數(shù)據(jù)處理與管理PPT課件_第2頁
SPSS軟件數(shù)據(jù)處理與管理PPT課件_第3頁
SPSS軟件數(shù)據(jù)處理與管理PPT課件_第4頁
SPSS軟件數(shù)據(jù)處理與管理PPT課件_第5頁
已閱讀5頁,還剩81頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

1、 SPSS的基本數(shù)據(jù)管理功能SPSS Basic Data Management參考文獻(xiàn):SPSS Programming and Data Management, 2nd Edition: A Guide for SPSS and SAS Users. SPSS Inc. 2005.第1頁/共86頁一、數(shù)據(jù)獲取二、變量屬性三、記錄排序四、文件拆分五、篩選記錄 六、數(shù)據(jù)文件的合并縱向合并七、數(shù)據(jù)文件的合并橫向合并八、通過計(jì)算產(chǎn)生新變量九、重新賦值十、排秩十一、重排格式十二、日期計(jì)算十三、隨機(jī)抽樣第2頁/共86頁一、數(shù)據(jù)獲取Getting Data into SPSS讀取SPSS數(shù)據(jù)文件:*.s

2、av , 常用的其他外部數(shù)據(jù)文件: *.xls , *.dbf , *.txt , *.dat, *.w*, *.sas7bdat, *.mdb 注意:醫(yī)學(xué)領(lǐng)域常用數(shù)據(jù)庫EpiData軟件,先將數(shù)據(jù)文件*.rec轉(zhuǎn)換為*.sps文件,然后在SPSS的語法窗口運(yùn)行,生成*.sav 文件。第3頁/共86頁數(shù)據(jù)獲取途徑第4頁/共86頁二、變量屬性Variable Properties:變量名。允許用中文,但習(xí)慣上采用英文變量名。:變量類型,常用數(shù)值型(Numeric)、字符型(String)、日期型(Date)。:變量寬度,默認(rèn)為8。:小數(shù)位數(shù),默認(rèn)為2。5.Label:變量編碼,又稱為變量標(biāo)簽,用

3、于注釋變量名的含義。第5頁/共86頁6.Values:變量值編碼,又稱為變量值標(biāo)簽,用于注釋變量值的含義。例如:變量sex,變量標(biāo)簽為“性別”;變量值為1與2,變量值編碼:1為“男性”,2為“女性”。:缺失值。默認(rèn)為系統(tǒng)缺失值,用“.”表示。:列寬,默認(rèn)為8。:對(duì)齊方式。數(shù)值型變量默認(rèn)右對(duì)齊(Right),字符型變量默認(rèn)左對(duì)齊(Left) 。:測(cè)度,包括三類:數(shù)值變量(Scale),名義變量或無序分類變量(Nominal),有序分類變量或等級(jí)變量(Ordinal)。第6頁/共86頁數(shù)據(jù)清單變量清單數(shù)據(jù)文件(數(shù)據(jù)窗口數(shù)據(jù)清單界面)第7頁/共86頁數(shù)據(jù)文件(數(shù)據(jù)窗口變量清單界面)注意:一行對(duì)應(yīng)一個(gè)

4、“記錄(Case)”;一列對(duì)應(yīng)一個(gè)“變量(Variable)”。此數(shù)據(jù)窗口不是一個(gè)很好的數(shù)據(jù)錄入界面。第8頁/共86頁刪除ex .sav文件中id為57的case,將文件另存為為以后使用方便,將ex .sav另存為如下數(shù)據(jù)庫(Save As.)第9頁/共86頁刪除ex .sav文件中id為14的case,將文件另存為第10頁/共86頁刪除ex .sav文件中變量sbp1dbp2,刪除id6的記錄,將文件另存為第11頁/共86頁只保留ex .sav文件中變量id、sbp1dbp2,刪除id7的記錄,將文件另存為第12頁/共86頁三、記錄排序Sort Cases 第13頁/共86頁ex .sav文

5、件中, 按照“height(身高)”的大小排序。升序降序第14頁/共86頁四、文件拆分 Split File 第15頁/共86頁比較組分組變量根據(jù)分組變量排序ex .sav文件中, 按照“sex(性別)”拆分文件第16頁/共86頁第17頁/共86頁分性別對(duì)“height(身高)”進(jìn)行統(tǒng)計(jì)描述描述性統(tǒng)計(jì)第18頁/共86頁第19頁/共86頁不同性別的“height(身高)”統(tǒng)計(jì)描述所有記錄的“height(身高)”統(tǒng)計(jì)描述注意:SPSS的輸出結(jié)果文件為*.spo第20頁/共86頁 五、篩選記錄 Select Cases第21頁/共86頁如果條件滿足過濾刪除selectunselect第22頁/共8

6、6頁篩選條件:有高血壓家族史(genic 0)第23頁/共86頁如果選用Deleted,則一定要將篩選后的文件另存一個(gè)文件名第24頁/共86頁filter_$變量,0表示未選中該記錄,1表示選中該記錄不符合條件的記錄,被用斜線篩除第25頁/共86頁有高血壓家族史的患者身高的統(tǒng)計(jì)描述所有患者身高的統(tǒng)計(jì)描述第26頁/共86頁六、數(shù)據(jù)文件的合并縱向合并:增加記錄Merge Files.Add Cases打開數(shù)據(jù)文件作為“工作數(shù)據(jù)文件”第27頁/共86頁打開作為“外部數(shù)據(jù)文件”第28頁/共86頁*代表工作數(shù)據(jù)文件,代表外部數(shù)據(jù)文件。第29頁/共86頁將連接后的文件另存一個(gè)文件名:第30頁/共86頁七、

7、數(shù)據(jù)文件的合并橫向合并:增加變量Merge Files.Add Variables打開作為“工作數(shù)據(jù)文件”第31頁/共86頁打開作為“外部數(shù)據(jù)文件”第32頁/共86頁(1)兩個(gè)文件均提供記錄(Both files provide cases)關(guān)鍵變量對(duì)于排序的文件,按照關(guān)鍵變量進(jìn)行匹配*代表工作數(shù)據(jù)文件,代表外部數(shù)據(jù)文件。第33頁/共86頁警告:如果數(shù)據(jù)未按照關(guān)鍵變量的升序進(jìn)行排序,那么不能按照關(guān)鍵變量匹配第34頁/共86頁連接后的數(shù)據(jù)文件,另存為第35頁/共86頁(2)按照關(guān)鍵變量,將外部數(shù)據(jù)文件匹配到工作數(shù)據(jù)文件中(External file is keyed table)。第36頁/共8

8、6頁連接后的數(shù)據(jù)文件,另存為第37頁/共86頁(3)按照關(guān)鍵變量,將工作數(shù)據(jù)文件匹配到外部數(shù)據(jù)文件中(Working file is keyed table)。第38頁/共86頁連接后的數(shù)據(jù)文件,另存為第39頁/共86頁八、通過計(jì)算產(chǎn)生新變量 compute第40頁/共86頁產(chǎn)生一個(gè)新變量:bmi體重/(身高)*2)第41頁/共86頁第42頁/共86頁九、重新賦值Recode. Into different variables第43頁/共86頁舊及新的變量值第44頁/共86頁根據(jù)bmi對(duì)7個(gè)記錄進(jìn)行分組,bmi: 正常:;超重:;肥胖:。第45頁/共86頁定義新的變量名:bmi _ gr第46

9、頁/共86頁第47頁/共86頁問題:當(dāng)bmi時(shí),bmi_gr的取何值?根據(jù)上述recode方法, bmi_gr為缺失值!解決辦法:RECODE bmi (18.0 thru =1) (24.0 thru =2) (28.0 thru Highest=3) INTO bmi_gr .EXECUTE .第48頁/共86頁十、排秩 rank cases第49頁/共86頁對(duì)sbp1(治療前SBP)進(jìn)行排秩第50頁/共86頁排秩后產(chǎn)生新變量rsbp1,其中對(duì)于相等的變量值(稱為結(jié)點(diǎn)ties)取平均秩次。本例中第2、3位的平均秩次為。第51頁/共86頁十一、重排格式Restructure第52頁/共86頁

10、1.將變量轉(zhuǎn)換為記錄 Restructure selected variables into cases 第53頁/共86頁將變量轉(zhuǎn)換為同一組第54頁/共86頁記錄標(biāo)識(shí)轉(zhuǎn)置后的新變量需要轉(zhuǎn)置的變量需要固定的變量第55頁/共86頁創(chuàng)建一個(gè)索引變量第56頁/共86頁索引變量的變量名按照自然數(shù)列對(duì)索引變量取值第57頁/共86頁未選取的變量從新數(shù)據(jù)庫中刪除第58頁/共86頁開始重排第59頁/共86頁重排后的數(shù)據(jù)文件。 第60頁/共86頁2.將記錄轉(zhuǎn)換為變量 Restructure selected cases into variables第61頁/共86頁第62頁/共86頁記錄標(biāo)識(shí)索引變量第63頁/共

11、86頁按照“記錄標(biāo)識(shí)”變量排序第64頁/共86頁按照原變量值順序,排列新變量組第65頁/共86頁開始重排第66頁/共86頁重排后的數(shù)據(jù)文件。 第67頁/共86頁十二、日期計(jì)算 Date/Time 第68頁/共86頁用日期與時(shí)間進(jìn)行計(jì)算第69頁/共86頁兩個(gè)日期之間的計(jì)算第70頁/共86頁Date1與Date2之差以“天”為單位第71頁/共86頁結(jié)果變量:day,單位為“天”變量標(biāo)簽第72頁/共86頁第73頁/共86頁十三、隨機(jī)抽樣 Random Sampling 步驟1 隨機(jī)數(shù)種子(Random Number Seed)的設(shè)定以數(shù)據(jù)文件data.sav為例第74頁/共86頁指定種子(此處以隨機(jī)

12、抽樣的日期為種子)第75頁/共86頁步驟2 隨機(jī)篩選記錄(Select Cases Randomly)第76頁/共86頁隨機(jī)抽取樣本單擊Sample按鈕第77頁/共86頁從前10個(gè)記錄中隨機(jī)抽取2個(gè)記錄第78頁/共86頁從前10個(gè)記錄中隨機(jī)抽取2個(gè)記錄第79頁/共86頁隨機(jī)抽樣的結(jié)果: 抽取了no為3、4的兩個(gè)記錄。第80頁/共86頁注意:1.隨機(jī)抽樣主要用于現(xiàn)場(chǎng)調(diào)查中,從總體中用簡單隨機(jī)的方法隨機(jī)抽取一個(gè)樣本。2.隨機(jī)抽樣的過程中,需要設(shè)定種子,以保證隨機(jī)抽樣結(jié)果是可重現(xiàn)的。(一般來說,如果不設(shè)定種子,那么第二次抽樣很可能與第一次抽樣的結(jié)果不同。)第81頁/共86頁小貼士:SPSS通過菜單,可以實(shí)現(xiàn)大部分的數(shù)據(jù)管理及統(tǒng)計(jì)分析功能,軟件操作簡單、易學(xué)。在學(xué)習(xí)SPSS時(shí),要養(yǎng)成一個(gè)好習(xí)慣:用語法文件(*.sps)保存每一步操作(只需要在每個(gè)對(duì)話框中點(diǎn)擊Paste,就可以將操作粘貼到語法窗口,即Syntax窗口)。這樣做,至少有兩個(gè)益處:1.避免重復(fù)地操作;2.很清楚地記錄了統(tǒng)計(jì)分析的過程。第82頁/共86頁如果您偷懶,從不保存語法文件1.您花了一整天的時(shí)間進(jìn)行了復(fù)雜的數(shù)據(jù)整理及統(tǒng)計(jì)分析幾天后,老板告訴您:數(shù)據(jù)庫需要?jiǎng)h除一個(gè)記錄,您要重新做統(tǒng)計(jì)!天?。榱诉@一個(gè)記錄,難道還要再花費(fèi)一整天重頭開始么?!第83頁/共86頁如果您偷懶,從不保存語法文件2.您花了

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論