![應(yīng)用統(tǒng)計(jì)學(xué)數(shù)據(jù)管理_第1頁](http://file4.renrendoc.com/view/58b7d8f0b07f65c2a0e74a2aa9847028/58b7d8f0b07f65c2a0e74a2aa98470281.gif)
![應(yīng)用統(tǒng)計(jì)學(xué)數(shù)據(jù)管理_第2頁](http://file4.renrendoc.com/view/58b7d8f0b07f65c2a0e74a2aa9847028/58b7d8f0b07f65c2a0e74a2aa98470282.gif)
![應(yīng)用統(tǒng)計(jì)學(xué)數(shù)據(jù)管理_第3頁](http://file4.renrendoc.com/view/58b7d8f0b07f65c2a0e74a2aa9847028/58b7d8f0b07f65c2a0e74a2aa98470283.gif)
![應(yīng)用統(tǒng)計(jì)學(xué)數(shù)據(jù)管理_第4頁](http://file4.renrendoc.com/view/58b7d8f0b07f65c2a0e74a2aa9847028/58b7d8f0b07f65c2a0e74a2aa98470284.gif)
![應(yīng)用統(tǒng)計(jì)學(xué)數(shù)據(jù)管理_第5頁](http://file4.renrendoc.com/view/58b7d8f0b07f65c2a0e74a2aa9847028/58b7d8f0b07f65c2a0e74a2aa98470285.gif)
版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
應(yīng)用統(tǒng)計(jì)學(xué)數(shù)據(jù)管理第1頁,課件共79頁,創(chuàng)作于2023年2月
在數(shù)據(jù)文件建立好之后,還需要對(duì)數(shù)據(jù)進(jìn)行必要的加工處理。對(duì)同一個(gè)數(shù)據(jù)往往需要從各種不同的側(cè)面進(jìn)行研究,采取多種統(tǒng)計(jì)方法進(jìn)行分析,而不同的統(tǒng)計(jì)方法對(duì)數(shù)據(jù)文件結(jié)構(gòu)的要求不盡相同,這就需要對(duì)數(shù)據(jù)文件的結(jié)構(gòu)進(jìn)行重新調(diào)整或轉(zhuǎn)換,以便適合于相同的統(tǒng)計(jì)方法。數(shù)據(jù)管理
文件級(jí)別的數(shù)據(jù)管理
變量級(jí)別的數(shù)據(jù)管理第2頁,課件共79頁,創(chuàng)作于2023年2月文件級(jí)別的數(shù)據(jù)管理(1)SPSS中的Data菜單提供了文件級(jí)別的數(shù)據(jù)管理,可以對(duì)整個(gè)數(shù)據(jù)文件進(jìn)行加工整理。第3頁,課件共79頁,創(chuàng)作于2023年2月
InsertVariable:插入變量
InsertCases:插入記錄
GotoCase:到達(dá)某條記錄
簡單命令(這些功能都可以用鼠標(biāo)在數(shù)據(jù)表界面直接完成,很少用菜單操作,在此不詳述)
SortCases:記錄排序
SplitFile:記錄拆分
SelectCases:記錄篩選
WeightCases:記錄加權(quán)
常用的簡單過程(使用頻繁,必須掌握)文件級(jí)別的數(shù)據(jù)管理(2)第4頁,課件共79頁,創(chuàng)作于2023年2月
DefineVariableProperties:定義數(shù)據(jù)字典
CopyVariableProperties
:將預(yù)定義的數(shù)據(jù)字典直接引入當(dāng)前數(shù)據(jù)文件,即復(fù)制外部數(shù)據(jù)文件屬性到當(dāng)前數(shù)據(jù)文件
變量與數(shù)據(jù)文件屬性向?qū)В▽?duì)大型或連續(xù)性數(shù)據(jù)分析項(xiàng)目非常有用)
Transpose:數(shù)據(jù)轉(zhuǎn)置
Restructure:數(shù)據(jù)文件的重新排列
數(shù)據(jù)重構(gòu)向?qū)募?jí)別的數(shù)據(jù)管理(3)第5頁,課件共79頁,創(chuàng)作于2023年2月
AddCases:縱向合并
AddVariable
:橫向合并
文件合并過程(MergeFiles)
DefineDates:定義日期變量過程,用于時(shí)間序列數(shù)據(jù)
Aggregate:數(shù)據(jù)匯總過程
IdentifyDuplicateCases:查找重復(fù)記錄
其他過程文件級(jí)別的數(shù)據(jù)管理(4)
正交設(shè)計(jì)過程(OrthogonalDesign)第6頁,課件共79頁,創(chuàng)作于2023年2月單變量排序:SPSS提供了一種簡易操作方法,即在數(shù)據(jù)表格的變量名處單擊右鍵,彈出右圖多變量排序:使用SortCases過程來進(jìn)行,查看詳情記錄排序第7頁,課件共79頁,創(chuàng)作于2023年2月記錄排序第8頁,課件共79頁,創(chuàng)作于2023年2月選中District,選擇升序選鈕(默認(rèn)),將District選入Sortby框選中Region,選擇降序選鈕,將Region選入Sortby框記錄排序第9頁,課件共79頁,創(chuàng)作于2023年2月注意:在多重排序中,指定排序變量名的次序很關(guān)鍵,首先安第一個(gè)變量排序,對(duì)于與第一個(gè)變量取值相同的記錄考慮按第二個(gè)變量排序排序后,原來記錄數(shù)據(jù)的排序?qū)⒈淮騺y,對(duì)于時(shí)間序列數(shù)據(jù),若未存放有記錄標(biāo)志的變量,應(yīng)注意保存原數(shù)據(jù)的排列順序,以免數(shù)據(jù)混亂記錄排序第10頁,課件共79頁,創(chuàng)作于2023年2月記錄拆分第11頁,課件共79頁,創(chuàng)作于2023年2月1.選中此框不拆分文件2.按所選變量拆分文件,各組分析結(jié)果放在一起便于比較3.按所選變量拆分文件,各組分析結(jié)果單獨(dú)放置4.用于選擇拆分?jǐn)?shù)據(jù)文件的變量5.要求將數(shù)據(jù)按所用拆分變量排序6.數(shù)據(jù)集很大,且拆分變量已排序,選此可節(jié)省運(yùn)行時(shí)間123456記錄拆分第12頁,課件共79頁,創(chuàng)作于2023年2月記錄篩選第13頁,課件共79頁,創(chuàng)作于2023年2月123451.分析所有記錄2.分析滿足條件的記錄,按If按鈕設(shè)定篩選條件3.從原數(shù)據(jù)中按某種條件抽樣,按Sample進(jìn)行設(shè)定4.基于時(shí)間或記錄序號(hào)選擇記錄,按Range進(jìn)行設(shè)定5.使用篩選指示變量選擇記錄,非0值的記錄被選中6.未選中的記錄被隔離7.未選中的記錄被刪除67記錄篩選第14頁,課件共79頁,創(chuàng)作于2023年2月記錄篩選第15頁,課件共79頁,創(chuàng)作于2023年2月記錄加權(quán)第16頁,課件共79頁,創(chuàng)作于2023年2月
設(shè)置作為權(quán)重的變量,如第一行表示agecat=1gender=1的人共33個(gè),accid表示人數(shù),應(yīng)設(shè)為權(quán)重記錄加權(quán)第17頁,課件共79頁,創(chuàng)作于2023年2月定義數(shù)據(jù)字典第18頁,課件共79頁,創(chuàng)作于2023年2月變量名、測(cè)量尺度等變量列表頻數(shù)、標(biāo)簽、缺失值設(shè)定等拷貝變量屬性自動(dòng)生成值標(biāo)簽定義數(shù)據(jù)字典第19頁,課件共79頁,創(chuàng)作于2023年2月數(shù)據(jù)轉(zhuǎn)置第20頁,課件共79頁,創(chuàng)作于2023年2月Transpose:該過程用于對(duì)數(shù)據(jù)進(jìn)行行列轉(zhuǎn)置,即原來的一條記錄轉(zhuǎn)成為一個(gè)變量,而變量則轉(zhuǎn)成為一個(gè)記錄,兩次Transpose過程后數(shù)據(jù)集會(huì)恢復(fù)原樣(點(diǎn)此見具體操作)。數(shù)據(jù)轉(zhuǎn)置第21頁,課件共79頁,創(chuàng)作于2023年2月將變量Group、x選入variable框,再點(diǎn)擊OK鍵轉(zhuǎn)置前的數(shù)據(jù)集轉(zhuǎn)置后的數(shù)據(jù)集
注:未選中的變量id其數(shù)據(jù)信息在轉(zhuǎn)置后丟失數(shù)據(jù)轉(zhuǎn)置第22頁,課件共79頁,創(chuàng)作于2023年2月數(shù)據(jù)文件重新排列第23頁,課件共79頁,創(chuàng)作于2023年2月Restructure:此過程是用來改變數(shù)據(jù)的排列格式,即長型格式和寬型格式之間的互轉(zhuǎn)。數(shù)據(jù)文件重新排列第24頁,課件共79頁,創(chuàng)作于2023年2月數(shù)據(jù)文件重新排列第25頁,課件共79頁,創(chuàng)作于2023年2月
數(shù)據(jù)anxiety轉(zhuǎn)換前后的長型格式和型格式數(shù)據(jù)文件重新排列第26頁,課件共79頁,創(chuàng)作于2023年2月文件縱向合并第27頁,課件共79頁,創(chuàng)作于2023年2月*:當(dāng)前數(shù)據(jù)集中的變量+:新添加數(shù)據(jù)集中的變量
左框:新、老數(shù)據(jù)文件中不匹配的變量名
右框:已匹配的變量名,選擇完成后單擊OK即可AddCases:縱向合并,從外部數(shù)據(jù)文件中增加記錄到當(dāng)前數(shù)據(jù)文件中,相互合并的數(shù)據(jù)文件中應(yīng)該有相同的變量。文件縱向合并第28頁,課件共79頁,創(chuàng)作于2023年2月文件橫向合并第29頁,課件共79頁,創(chuàng)作于2023年2月1.
未被納入的變量列2.
被納入合并后新數(shù)據(jù)集的變量列表3.
記錄匹配使用的關(guān)鍵變量AddVariables:橫向合并,從外部數(shù)據(jù)文件增加變量到當(dāng)前數(shù)據(jù)文件,兩個(gè)數(shù)據(jù)集要有一個(gè)一一對(duì)應(yīng)的關(guān)鍵變量進(jìn)行匹配合并,且記錄應(yīng)按關(guān)鍵變量升序后再合并。123文件橫向合并第30頁,課件共79頁,創(chuàng)作于2023年2月數(shù)據(jù)匯總第31頁,課件共79頁,創(chuàng)作于2023年2月分組變量被匯總變量數(shù)據(jù)匯總第32頁,課件共79頁,創(chuàng)作于2023年2月
定義匯總函數(shù)
定義新產(chǎn)生匯總變量的名稱和標(biāo)簽FunctionName&Label數(shù)據(jù)匯總第33頁,課件共79頁,創(chuàng)作于2023年2月查找重復(fù)記錄第34頁,課件共79頁,創(chuàng)作于2023年2月希望查找重復(fù)值的變量重復(fù)記錄按該變量的取值排序設(shè)定第一個(gè)還是最后一個(gè)重復(fù)記錄為主記錄查找重復(fù)記錄第35頁,課件共79頁,創(chuàng)作于2023年2月PrimaryLast=0表示相應(yīng)的記錄為重復(fù)記錄查找重復(fù)記錄第36頁,課件共79頁,創(chuàng)作于2023年2月變量級(jí)別的數(shù)據(jù)管理(1)SPSS中的Transform菜單提供了變量級(jí)別的數(shù)據(jù)管理,可以對(duì)變量進(jìn)行操作。第37頁,課件共79頁,創(chuàng)作于2023年2月
計(jì)算新變量(Compute):最常用
Recode:對(duì)變量值進(jìn)行分組合并
VisualBander:連續(xù)變量的可視化分段
Count:表示某個(gè)變量的取值中是否出現(xiàn)某個(gè)值,或某個(gè)區(qū)間
RankCases:變量編秩
AutomaticRecode:對(duì)記錄按某個(gè)變量值的大小排序
變量轉(zhuǎn)換變量級(jí)別的數(shù)據(jù)管理(2)第38頁,課件共79頁,創(chuàng)作于2023年2月
CreateTimeSeries:建立時(shí)間序列
ReplaceMissingValues:缺失值替代
RandomNumberSeed:設(shè)定隨機(jī)種子
專用過程變量級(jí)別的數(shù)據(jù)管理(3)
控制命令
RunPendingTransforms:用于執(zhí)行編程中被掛起的數(shù)據(jù)整理操作專用于時(shí)間序列模型第39頁,課件共79頁,創(chuàng)作于2023年2月例1
數(shù)據(jù)fee.sav是上海和杭州16名住院病人的費(fèi)用數(shù)據(jù),計(jì)算上海的住院病人平均每天的住院費(fèi)用,要求結(jié)果取整。計(jì)算新變量第40頁,課件共79頁,創(chuàng)作于2023年2月輸入新變量名perfee計(jì)算新變量第41頁,課件共79頁,創(chuàng)作于2023年2月計(jì)算新變量輸入條件表達(dá)式第42頁,課件共79頁,創(chuàng)作于2023年2月計(jì)算新變量選擇函數(shù)輸入函數(shù)表達(dá)式第43頁,課件共79頁,創(chuàng)作于2023年2月計(jì)算新變量第44頁,課件共79頁,創(chuàng)作于2023年2月例2
在數(shù)據(jù)fee.sav中生成新變量grade,當(dāng)住院總費(fèi)用小于5000元時(shí)取值為“相對(duì)較低”,大于等于5000元且小于7000元取值為“中等”,大于等于7000元且小于10000元為“較高”,大于等于10000元為“很高”。變量值分組合并第45頁,課件共79頁,創(chuàng)作于2023年2月新變量名grade選入原變量total變量值分組合并第46頁,課件共79頁,創(chuàng)作于2023年2月變量值分組合并第47頁,課件共79頁,創(chuàng)作于2023年2月
三種Range的設(shè)置,所有的范圍均包含了端點(diǎn),而前面設(shè)定的變換會(huì)優(yōu)于后面的變換,因此應(yīng)該將大于等于10000元最先設(shè)定,而將小于5000元最后設(shè)定。變量值分組合并第48頁,課件共79頁,創(chuàng)作于2023年2月變量值分組合并第49頁,課件共79頁,創(chuàng)作于2023年2月變量值分組合并第50頁,課件共79頁,創(chuàng)作于2023年2月變量值分組合并第51頁,課件共79頁,創(chuàng)作于2023年2月務(wù)必選上該項(xiàng)變量值分組合并第52頁,課件共79頁,創(chuàng)作于2023年2月變量值分組合并第53頁,課件共79頁,創(chuàng)作于2023年2月recode過程提供了精確分組的功能,但如果希望進(jìn)行的分組是有規(guī)律的,比如等距分組,或等樣本量分組,使用
recode過程進(jìn)行操作就顯得非常麻煩,且可視化程度不高。此時(shí)可以考慮使用visualbander過程進(jìn)行可視化分段。連續(xù)變量的可視化分段第54頁,課件共79頁,創(chuàng)作于2023年2月例3
仍以數(shù)據(jù)fee.sav為例,按變量total將病人分為5組,5000元以下為第一組,5000元以上的按等間距的方式分4組。連續(xù)變量的可視化分段第55頁,課件共79頁,創(chuàng)作于2023年2月連續(xù)變量的可視化分段第56頁,課件共79頁,創(chuàng)作于2023年2月連續(xù)變量的可視化分段第57頁,課件共79頁,創(chuàng)作于2023年2月設(shè)定分段規(guī)則連續(xù)變量的可視化分段第58頁,課件共79頁,創(chuàng)作于2023年2月連續(xù)變量的可視化分段自動(dòng)填充值標(biāo)簽第59頁,課件共79頁,創(chuàng)作于2023年2月連續(xù)變量的可視化分段第60頁,課件共79頁,創(chuàng)作于2023年2月例4
仍以數(shù)據(jù)fee.sav為例,查看變量total中是否出現(xiàn)值6890。查看特定變量值第61頁,課件共79頁,創(chuàng)作于2023年2月查看特定變量值第62頁,課件共79頁,創(chuàng)作于2023年2月查看特定變量值第63頁,課件共79頁,創(chuàng)作于2023年2月查看特定變量值第64頁,課件共79頁,創(chuàng)作于2023年2月查看特定變量值第65頁,課件共79頁,創(chuàng)作于2023年2月例5
仍以數(shù)據(jù)fee.sav為例,根據(jù)城市分組計(jì)算住院總費(fèi)用的
秩次。變量編秩第66頁,課件共79頁,創(chuàng)作于2023年2月變量編秩第67頁,課件共79頁,創(chuàng)作于2023年2月
用于定義秩次類型,默認(rèn)為rank(秩分?jǐn)?shù))變量編秩第68頁,課件共79頁,創(chuàng)作于2023年2月
用于定義對(duì)相同值觀測(cè)量的處理方式默認(rèn)值為取平均秩次。變量編秩第69頁,課件共79頁,創(chuàng)作于2023年2月變量編秩第70頁,課件共79頁,創(chuàng)作于2023年2月將字符變量轉(zhuǎn)換為數(shù)值變量例6
仍以數(shù)據(jù)fee
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 年春節(jié)放假通知
- 幽默婚禮致辭(15篇)
- 海水的運(yùn)動(dòng)+導(dǎo)學(xué)案 高一上學(xué)期+地理+人教版(2019)必修一
- 論歐龍馬滴劑治療小兒慢性鼻竇炎的療效研究
- 二零二五年度企業(yè)形象宣傳品定制采購協(xié)議書3篇
- 育齡期女性乳腺癌患者生育憂慮的混合研究
- 二零二五版新型城鎮(zhèn)化建設(shè)項(xiàng)目物業(yè)管理合同范本3篇
- 三自由度波浪補(bǔ)償風(fēng)電過橋裝置系統(tǒng)研究
- 2023-2024學(xué)年高一秋學(xué)期期末語文模擬測(cè)試(二)試題講評(píng)課件 上課課件
- 復(fù)雜環(huán)境下的智能挖掘機(jī)目標(biāo)檢測(cè)研究
- 城市基礎(chǔ)設(shè)施修繕工程的重點(diǎn)與應(yīng)對(duì)措施
- GB 12710-2024焦化安全規(guī)范
- 【??途W(wǎng)】2024秋季校園招聘白皮書
- 腫瘤中醫(yī)治療及調(diào)養(yǎng)
- 術(shù)后肺炎預(yù)防和控制專家共識(shí)解讀課件
- 中石化高級(jí)職稱英語考試
- 醫(yī)院病房用電安全宣教
- 旅游行業(yè)智能客服解決方案
- 六年級(jí)上冊(cè)分?jǐn)?shù)乘除混合運(yùn)算400題及答案
- 醫(yī)療器械經(jīng)營規(guī)范培訓(xùn)
- 行政處罰-行政處罰種類和設(shè)定(行政法課件)
評(píng)論
0/150
提交評(píng)論