應(yīng)用統(tǒng)計(jì)學(xué)數(shù)據(jù)管理_第1頁
應(yīng)用統(tǒng)計(jì)學(xué)數(shù)據(jù)管理_第2頁
應(yīng)用統(tǒng)計(jì)學(xué)數(shù)據(jù)管理_第3頁
應(yīng)用統(tǒng)計(jì)學(xué)數(shù)據(jù)管理_第4頁
應(yīng)用統(tǒng)計(jì)學(xué)數(shù)據(jù)管理_第5頁
已閱讀5頁,還剩74頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

應(yīng)用統(tǒng)計(jì)學(xué)數(shù)據(jù)管理第1頁,課件共79頁,創(chuàng)作于2023年2月

在數(shù)據(jù)文件建立好之后,還需要對(duì)數(shù)據(jù)進(jìn)行必要的加工處理。對(duì)同一個(gè)數(shù)據(jù)往往需要從各種不同的側(cè)面進(jìn)行研究,采取多種統(tǒng)計(jì)方法進(jìn)行分析,而不同的統(tǒng)計(jì)方法對(duì)數(shù)據(jù)文件結(jié)構(gòu)的要求不盡相同,這就需要對(duì)數(shù)據(jù)文件的結(jié)構(gòu)進(jìn)行重新調(diào)整或轉(zhuǎn)換,以便適合于相同的統(tǒng)計(jì)方法。數(shù)據(jù)管理

文件級(jí)別的數(shù)據(jù)管理

變量級(jí)別的數(shù)據(jù)管理第2頁,課件共79頁,創(chuàng)作于2023年2月文件級(jí)別的數(shù)據(jù)管理(1)SPSS中的Data菜單提供了文件級(jí)別的數(shù)據(jù)管理,可以對(duì)整個(gè)數(shù)據(jù)文件進(jìn)行加工整理。第3頁,課件共79頁,創(chuàng)作于2023年2月

InsertVariable:插入變量

InsertCases:插入記錄

GotoCase:到達(dá)某條記錄

簡單命令(這些功能都可以用鼠標(biāo)在數(shù)據(jù)表界面直接完成,很少用菜單操作,在此不詳述)

SortCases:記錄排序

SplitFile:記錄拆分

SelectCases:記錄篩選

WeightCases:記錄加權(quán)

常用的簡單過程(使用頻繁,必須掌握)文件級(jí)別的數(shù)據(jù)管理(2)第4頁,課件共79頁,創(chuàng)作于2023年2月

DefineVariableProperties:定義數(shù)據(jù)字典

CopyVariableProperties

:將預(yù)定義的數(shù)據(jù)字典直接引入當(dāng)前數(shù)據(jù)文件,即復(fù)制外部數(shù)據(jù)文件屬性到當(dāng)前數(shù)據(jù)文件

變量與數(shù)據(jù)文件屬性向?qū)В▽?duì)大型或連續(xù)性數(shù)據(jù)分析項(xiàng)目非常有用)

Transpose:數(shù)據(jù)轉(zhuǎn)置

Restructure:數(shù)據(jù)文件的重新排列

數(shù)據(jù)重構(gòu)向?qū)募?jí)別的數(shù)據(jù)管理(3)第5頁,課件共79頁,創(chuàng)作于2023年2月

AddCases:縱向合并

AddVariable

:橫向合并

文件合并過程(MergeFiles)

DefineDates:定義日期變量過程,用于時(shí)間序列數(shù)據(jù)

Aggregate:數(shù)據(jù)匯總過程

IdentifyDuplicateCases:查找重復(fù)記錄

其他過程文件級(jí)別的數(shù)據(jù)管理(4)

正交設(shè)計(jì)過程(OrthogonalDesign)第6頁,課件共79頁,創(chuàng)作于2023年2月單變量排序:SPSS提供了一種簡易操作方法,即在數(shù)據(jù)表格的變量名處單擊右鍵,彈出右圖多變量排序:使用SortCases過程來進(jìn)行,查看詳情記錄排序第7頁,課件共79頁,創(chuàng)作于2023年2月記錄排序第8頁,課件共79頁,創(chuàng)作于2023年2月選中District,選擇升序選鈕(默認(rèn)),將District選入Sortby框選中Region,選擇降序選鈕,將Region選入Sortby框記錄排序第9頁,課件共79頁,創(chuàng)作于2023年2月注意:在多重排序中,指定排序變量名的次序很關(guān)鍵,首先安第一個(gè)變量排序,對(duì)于與第一個(gè)變量取值相同的記錄考慮按第二個(gè)變量排序排序后,原來記錄數(shù)據(jù)的排序?qū)⒈淮騺y,對(duì)于時(shí)間序列數(shù)據(jù),若未存放有記錄標(biāo)志的變量,應(yīng)注意保存原數(shù)據(jù)的排列順序,以免數(shù)據(jù)混亂記錄排序第10頁,課件共79頁,創(chuàng)作于2023年2月記錄拆分第11頁,課件共79頁,創(chuàng)作于2023年2月1.選中此框不拆分文件2.按所選變量拆分文件,各組分析結(jié)果放在一起便于比較3.按所選變量拆分文件,各組分析結(jié)果單獨(dú)放置4.用于選擇拆分?jǐn)?shù)據(jù)文件的變量5.要求將數(shù)據(jù)按所用拆分變量排序6.數(shù)據(jù)集很大,且拆分變量已排序,選此可節(jié)省運(yùn)行時(shí)間123456記錄拆分第12頁,課件共79頁,創(chuàng)作于2023年2月記錄篩選第13頁,課件共79頁,創(chuàng)作于2023年2月123451.分析所有記錄2.分析滿足條件的記錄,按If按鈕設(shè)定篩選條件3.從原數(shù)據(jù)中按某種條件抽樣,按Sample進(jìn)行設(shè)定4.基于時(shí)間或記錄序號(hào)選擇記錄,按Range進(jìn)行設(shè)定5.使用篩選指示變量選擇記錄,非0值的記錄被選中6.未選中的記錄被隔離7.未選中的記錄被刪除67記錄篩選第14頁,課件共79頁,創(chuàng)作于2023年2月記錄篩選第15頁,課件共79頁,創(chuàng)作于2023年2月記錄加權(quán)第16頁,課件共79頁,創(chuàng)作于2023年2月

設(shè)置作為權(quán)重的變量,如第一行表示agecat=1gender=1的人共33個(gè),accid表示人數(shù),應(yīng)設(shè)為權(quán)重記錄加權(quán)第17頁,課件共79頁,創(chuàng)作于2023年2月定義數(shù)據(jù)字典第18頁,課件共79頁,創(chuàng)作于2023年2月變量名、測(cè)量尺度等變量列表頻數(shù)、標(biāo)簽、缺失值設(shè)定等拷貝變量屬性自動(dòng)生成值標(biāo)簽定義數(shù)據(jù)字典第19頁,課件共79頁,創(chuàng)作于2023年2月數(shù)據(jù)轉(zhuǎn)置第20頁,課件共79頁,創(chuàng)作于2023年2月Transpose:該過程用于對(duì)數(shù)據(jù)進(jìn)行行列轉(zhuǎn)置,即原來的一條記錄轉(zhuǎn)成為一個(gè)變量,而變量則轉(zhuǎn)成為一個(gè)記錄,兩次Transpose過程后數(shù)據(jù)集會(huì)恢復(fù)原樣(點(diǎn)此見具體操作)。數(shù)據(jù)轉(zhuǎn)置第21頁,課件共79頁,創(chuàng)作于2023年2月將變量Group、x選入variable框,再點(diǎn)擊OK鍵轉(zhuǎn)置前的數(shù)據(jù)集轉(zhuǎn)置后的數(shù)據(jù)集

注:未選中的變量id其數(shù)據(jù)信息在轉(zhuǎn)置后丟失數(shù)據(jù)轉(zhuǎn)置第22頁,課件共79頁,創(chuàng)作于2023年2月數(shù)據(jù)文件重新排列第23頁,課件共79頁,創(chuàng)作于2023年2月Restructure:此過程是用來改變數(shù)據(jù)的排列格式,即長型格式和寬型格式之間的互轉(zhuǎn)。數(shù)據(jù)文件重新排列第24頁,課件共79頁,創(chuàng)作于2023年2月數(shù)據(jù)文件重新排列第25頁,課件共79頁,創(chuàng)作于2023年2月

數(shù)據(jù)anxiety轉(zhuǎn)換前后的長型格式和型格式數(shù)據(jù)文件重新排列第26頁,課件共79頁,創(chuàng)作于2023年2月文件縱向合并第27頁,課件共79頁,創(chuàng)作于2023年2月*:當(dāng)前數(shù)據(jù)集中的變量+:新添加數(shù)據(jù)集中的變量

左框:新、老數(shù)據(jù)文件中不匹配的變量名

右框:已匹配的變量名,選擇完成后單擊OK即可AddCases:縱向合并,從外部數(shù)據(jù)文件中增加記錄到當(dāng)前數(shù)據(jù)文件中,相互合并的數(shù)據(jù)文件中應(yīng)該有相同的變量。文件縱向合并第28頁,課件共79頁,創(chuàng)作于2023年2月文件橫向合并第29頁,課件共79頁,創(chuàng)作于2023年2月1.

未被納入的變量列2.

被納入合并后新數(shù)據(jù)集的變量列表3.

記錄匹配使用的關(guān)鍵變量AddVariables:橫向合并,從外部數(shù)據(jù)文件增加變量到當(dāng)前數(shù)據(jù)文件,兩個(gè)數(shù)據(jù)集要有一個(gè)一一對(duì)應(yīng)的關(guān)鍵變量進(jìn)行匹配合并,且記錄應(yīng)按關(guān)鍵變量升序后再合并。123文件橫向合并第30頁,課件共79頁,創(chuàng)作于2023年2月數(shù)據(jù)匯總第31頁,課件共79頁,創(chuàng)作于2023年2月分組變量被匯總變量數(shù)據(jù)匯總第32頁,課件共79頁,創(chuàng)作于2023年2月

定義匯總函數(shù)

定義新產(chǎn)生匯總變量的名稱和標(biāo)簽FunctionName&Label數(shù)據(jù)匯總第33頁,課件共79頁,創(chuàng)作于2023年2月查找重復(fù)記錄第34頁,課件共79頁,創(chuàng)作于2023年2月希望查找重復(fù)值的變量重復(fù)記錄按該變量的取值排序設(shè)定第一個(gè)還是最后一個(gè)重復(fù)記錄為主記錄查找重復(fù)記錄第35頁,課件共79頁,創(chuàng)作于2023年2月PrimaryLast=0表示相應(yīng)的記錄為重復(fù)記錄查找重復(fù)記錄第36頁,課件共79頁,創(chuàng)作于2023年2月變量級(jí)別的數(shù)據(jù)管理(1)SPSS中的Transform菜單提供了變量級(jí)別的數(shù)據(jù)管理,可以對(duì)變量進(jìn)行操作。第37頁,課件共79頁,創(chuàng)作于2023年2月

計(jì)算新變量(Compute):最常用

Recode:對(duì)變量值進(jìn)行分組合并

VisualBander:連續(xù)變量的可視化分段

Count:表示某個(gè)變量的取值中是否出現(xiàn)某個(gè)值,或某個(gè)區(qū)間

RankCases:變量編秩

AutomaticRecode:對(duì)記錄按某個(gè)變量值的大小排序

變量轉(zhuǎn)換變量級(jí)別的數(shù)據(jù)管理(2)第38頁,課件共79頁,創(chuàng)作于2023年2月

CreateTimeSeries:建立時(shí)間序列

ReplaceMissingValues:缺失值替代

RandomNumberSeed:設(shè)定隨機(jī)種子

專用過程變量級(jí)別的數(shù)據(jù)管理(3)

控制命令

RunPendingTransforms:用于執(zhí)行編程中被掛起的數(shù)據(jù)整理操作專用于時(shí)間序列模型第39頁,課件共79頁,創(chuàng)作于2023年2月例1

數(shù)據(jù)fee.sav是上海和杭州16名住院病人的費(fèi)用數(shù)據(jù),計(jì)算上海的住院病人平均每天的住院費(fèi)用,要求結(jié)果取整。計(jì)算新變量第40頁,課件共79頁,創(chuàng)作于2023年2月輸入新變量名perfee計(jì)算新變量第41頁,課件共79頁,創(chuàng)作于2023年2月計(jì)算新變量輸入條件表達(dá)式第42頁,課件共79頁,創(chuàng)作于2023年2月計(jì)算新變量選擇函數(shù)輸入函數(shù)表達(dá)式第43頁,課件共79頁,創(chuàng)作于2023年2月計(jì)算新變量第44頁,課件共79頁,創(chuàng)作于2023年2月例2

在數(shù)據(jù)fee.sav中生成新變量grade,當(dāng)住院總費(fèi)用小于5000元時(shí)取值為“相對(duì)較低”,大于等于5000元且小于7000元取值為“中等”,大于等于7000元且小于10000元為“較高”,大于等于10000元為“很高”。變量值分組合并第45頁,課件共79頁,創(chuàng)作于2023年2月新變量名grade選入原變量total變量值分組合并第46頁,課件共79頁,創(chuàng)作于2023年2月變量值分組合并第47頁,課件共79頁,創(chuàng)作于2023年2月

三種Range的設(shè)置,所有的范圍均包含了端點(diǎn),而前面設(shè)定的變換會(huì)優(yōu)于后面的變換,因此應(yīng)該將大于等于10000元最先設(shè)定,而將小于5000元最后設(shè)定。變量值分組合并第48頁,課件共79頁,創(chuàng)作于2023年2月變量值分組合并第49頁,課件共79頁,創(chuàng)作于2023年2月變量值分組合并第50頁,課件共79頁,創(chuàng)作于2023年2月變量值分組合并第51頁,課件共79頁,創(chuàng)作于2023年2月務(wù)必選上該項(xiàng)變量值分組合并第52頁,課件共79頁,創(chuàng)作于2023年2月變量值分組合并第53頁,課件共79頁,創(chuàng)作于2023年2月recode過程提供了精確分組的功能,但如果希望進(jìn)行的分組是有規(guī)律的,比如等距分組,或等樣本量分組,使用

recode過程進(jìn)行操作就顯得非常麻煩,且可視化程度不高。此時(shí)可以考慮使用visualbander過程進(jìn)行可視化分段。連續(xù)變量的可視化分段第54頁,課件共79頁,創(chuàng)作于2023年2月例3

仍以數(shù)據(jù)fee.sav為例,按變量total將病人分為5組,5000元以下為第一組,5000元以上的按等間距的方式分4組。連續(xù)變量的可視化分段第55頁,課件共79頁,創(chuàng)作于2023年2月連續(xù)變量的可視化分段第56頁,課件共79頁,創(chuàng)作于2023年2月連續(xù)變量的可視化分段第57頁,課件共79頁,創(chuàng)作于2023年2月設(shè)定分段規(guī)則連續(xù)變量的可視化分段第58頁,課件共79頁,創(chuàng)作于2023年2月連續(xù)變量的可視化分段自動(dòng)填充值標(biāo)簽第59頁,課件共79頁,創(chuàng)作于2023年2月連續(xù)變量的可視化分段第60頁,課件共79頁,創(chuàng)作于2023年2月例4

仍以數(shù)據(jù)fee.sav為例,查看變量total中是否出現(xiàn)值6890。查看特定變量值第61頁,課件共79頁,創(chuàng)作于2023年2月查看特定變量值第62頁,課件共79頁,創(chuàng)作于2023年2月查看特定變量值第63頁,課件共79頁,創(chuàng)作于2023年2月查看特定變量值第64頁,課件共79頁,創(chuàng)作于2023年2月查看特定變量值第65頁,課件共79頁,創(chuàng)作于2023年2月例5

仍以數(shù)據(jù)fee.sav為例,根據(jù)城市分組計(jì)算住院總費(fèi)用的

秩次。變量編秩第66頁,課件共79頁,創(chuàng)作于2023年2月變量編秩第67頁,課件共79頁,創(chuàng)作于2023年2月

用于定義秩次類型,默認(rèn)為rank(秩分?jǐn)?shù))變量編秩第68頁,課件共79頁,創(chuàng)作于2023年2月

用于定義對(duì)相同值觀測(cè)量的處理方式默認(rèn)值為取平均秩次。變量編秩第69頁,課件共79頁,創(chuàng)作于2023年2月變量編秩第70頁,課件共79頁,創(chuàng)作于2023年2月將字符變量轉(zhuǎn)換為數(shù)值變量例6

仍以數(shù)據(jù)fee

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論