應用統(tǒng)計學數(shù)據(jù)管理-業(yè)務分析-全文在線閱讀-_第1頁
應用統(tǒng)計學數(shù)據(jù)管理-業(yè)務分析-全文在線閱讀-_第2頁
應用統(tǒng)計學數(shù)據(jù)管理-業(yè)務分析-全文在線閱讀-_第3頁
應用統(tǒng)計學數(shù)據(jù)管理-業(yè)務分析-全文在線閱讀-_第4頁
應用統(tǒng)計學數(shù)據(jù)管理-業(yè)務分析-全文在線閱讀-_第5頁
已閱讀5頁,還剩74頁未讀 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

數(shù)據(jù)管理重慶交通大學管理學院7/12/20221:21:18數(shù)據(jù)管理·

在數(shù)據(jù)文件建立好之后,還需要對數(shù)據(jù)進行必要的加工處理。對同一個數(shù)據(jù)往往需要從各種不同的側面進行研究,采取多種統(tǒng)計方法進行分析,而不同的統(tǒng)計方法對數(shù)據(jù)文件結構的要求不盡相同,這就需要對數(shù)據(jù)文件的結構進行重新調整或轉換,以便適合于相同的統(tǒng)計方法。文件級別的數(shù)據(jù)管理

變量級別的數(shù)據(jù)管理重慶交通大學管理學院7/12/20221:21:18文件級別的數(shù)據(jù)管理(1)·SPSS中的Data菜單提供了文件級別的數(shù)據(jù)管理,可以對整個數(shù)據(jù)文件進行加工整理。重慶交通大學管理學院7/12/20221:21:18簡單命令(這些功能都可以用鼠標在數(shù)據(jù)表界面直接完成,很少用菜單操作,在此不詳述)Insert

Variable:插入變量Insert

Cases:插入記錄Go

to

Case:到達某條記錄常用的簡單過程(使用頻繁,必須掌握) Sort

Cases:記錄排序Split

File:記錄拆分Select

Cases:記錄篩選Weight

Cases:記錄加權重慶交通大學管理學院7/12/20221:21:18文件級別的數(shù)據(jù)管理(2)變量與數(shù)據(jù)文件屬性向導(對大型或連續(xù)性數(shù)據(jù)分析項目非常有用)Define

Variable

Properties:定義數(shù)據(jù)字典Copy

Variable

Properties

:將預定義的數(shù)據(jù)字典直接引入當前數(shù)據(jù)文件,即復制外部數(shù)據(jù)文件屬性到當前數(shù)據(jù)文件數(shù)據(jù)重構向導Transpose:數(shù)據(jù)轉置Restructure:數(shù)據(jù)文件的重新排列重慶交通大學管理學院7/12/20221:21:19文件級別的數(shù)據(jù)管理(3)文件合并過程(Merge

Files)Add

Cases:縱向合并Add

Variable

:橫向合并正交設計過程(Orthogonal

Design)其他過程Define

Dates:定義日期變量過程,用于時間序列數(shù)據(jù)Aggregate:數(shù)據(jù)匯總過程Identify

Duplicate

Cases:查找重復記錄重慶交通大學管理學院7/12/20221:21:19文件級別的數(shù)據(jù)管理(4)單變量排序:SPSS提供了一種簡易操作方法,即在數(shù)據(jù)表格的變量名處單擊右鍵,彈出右圖多變量排序:使用Sort

Cases過程來進行,查看詳情記錄排序重慶交通大學管理學院7/12/20221:21:19記錄排序重慶交通大學管理學院7/12/20221:21:19選中District,選擇升序選鈕(默認),將District選入Sort

by重慶交通大學管理學院7/12/20221:21:19選中Region,選擇降序選鈕,將Region選入Sort

by框記錄排序注意:在多重排序中,指定排序變量名的次序很關鍵,首先安第一個變量排序,對于與第一個變量取值相同的記錄考慮按第二個變量排序排序后,原來記錄數(shù)據(jù)的排序將被打亂,對于時間序列數(shù)據(jù),若未存放有記錄標志的變量,應注意保存原數(shù)據(jù)的排列順序,以免數(shù)據(jù)混亂記錄排序重慶交通大學管理學院7/12/20221:21:19記錄拆分重慶交通大學管理學院7/12/20221:21:19123456選中此框不拆分文件按所選變量拆分文件,各組分析結果放在一起便于比3較3較.按所選變量拆分文件,各組分析結果單獨放置用于選擇拆分數(shù)據(jù)文件的變量要求將數(shù)據(jù)按所用拆分變量排序數(shù)據(jù)集很大,且拆分變量已排序,選此可節(jié)省運行時間重慶交通大學管理學院7/12/20221:21:19記錄拆分記錄篩選重慶交通大學管理學院7/12/20221:21:191重慶交通大學管理學院7/12/20221:21:1923451.分析所有記錄2.分析滿足條件的記錄,按If按鈕設定篩選條件3.從原數(shù)據(jù)中按某種條件抽樣,按Sample進行設定4.基于時間或記錄序號選擇記錄,按Range進行設定使用篩選指示變量選擇記錄,非0值的記錄被選中未選中的記錄被隔離未選中的記錄被刪除67記錄篩選記錄篩選重慶交通大學管理學院7/12/20221:21:19記錄加權重慶交通大學管理學院7/12/20221:21:19·

設置作為權重的變量,如第一行表示agecat=1

gender=1的人共33個,accid表示人數(shù),應設為權重記錄加權重慶交通大學管理學院7/12/20221:21:19定義數(shù)據(jù)字典重慶交通大學管理學院7/12/20221:21:19變量名、測量尺度等變量列表頻數(shù)、標簽、缺失值設定等拷貝變量屬性自動生成值標簽定義數(shù)據(jù)字典重慶交通大學管理學院7/12/20221:21:19數(shù)據(jù)轉置重慶交通大學管理學院7/12/20221:21:20·Transpose:該過程用于對數(shù)據(jù)進行行列轉置,即原來的一條記錄轉成為一個變量,而變量則轉成為一個記錄,兩次Transpose過程后數(shù)據(jù)集會恢復原樣(點此見具體操作)。重慶交通大學管理學院7/12/20221:21:20數(shù)據(jù)轉置將變量Group、x選入variable框,再點擊OK鍵轉置前的數(shù)據(jù)集轉置后的數(shù)據(jù)集·

注:未選中的變量id其數(shù)據(jù)信息在轉置后丟失數(shù)據(jù)轉置重慶交通大學管理學院7/12/20221:21:20數(shù)據(jù)文件重新排列重慶交通大學管理學院7/12/20221:21:20Restructure:此過程是用來改變數(shù)據(jù)的排列格式,即長型格式和寬型格式之間的互轉。數(shù)據(jù)文件重新排列重慶交通大學管理學院7/12/20221:21:20數(shù)據(jù)文件重新排列重慶交通大學管理學院7/12/20221:21:20·

數(shù)據(jù)anxiety轉換前后的長型格式和型格式重慶交通大學管理學院7/12/20221:21:20數(shù)據(jù)文件重新排列文件縱向合并重慶交通大學管理學院7/12/20221:21:20AddCases:縱向合并,從外部數(shù)據(jù)文件中增加記錄到當前數(shù)據(jù)文件中,相互合并的數(shù)據(jù)文件中應該有相同的變量。左框:新、老數(shù)據(jù)文件中不匹配的變量名*:當前數(shù)據(jù)集中的變量+:新添加數(shù)據(jù)集中的變量右框:已匹配的變量名,選擇完成后單擊OK即可文件縱向合并重慶交通大學管理學院7/12/20221:21:20文件橫向合并重慶交通大學管理學院7/12/20221:21:20Add

Variables:橫向合并,從外部數(shù)據(jù)文件增加變量到當前數(shù)據(jù)文件,兩個數(shù)據(jù)集要有一個一一對應的關鍵變量進行匹配合并,且記錄應按關鍵變量升序后再合并。未被納入的變量列被納入合并后新數(shù)據(jù)集的變量列表記錄匹配使用的關鍵變量123文件橫向合并重慶交通大學管理學院7/12/20221:21:21數(shù)據(jù)匯總重慶交通大學管理學院7/12/20221:21:21分組變量被匯總變量數(shù)據(jù)匯總重慶交通大學管理學院7/12/20221:21:21·

定義匯總函數(shù)·

定義新產(chǎn)生匯總變量的重慶交通大學管理學院7/12/20221:21:21名稱和標簽FunctionName&Label數(shù)據(jù)匯總查找重復記錄重慶交通大學管理學院7/12/20221:21:21希望查找重復值的變量重復記錄按該變量的取值排序設定第一個還是最后一個重復記錄為主記錄重慶交通大學管理學院7/12/20221:21:21查找重復記錄·

PrimaryLast=0表示相應的記錄為重復記錄重慶交通大學管理學院7/12/20221:21:21查找重復記錄變量級別的數(shù)據(jù)管理(1)·

SPSS中的Transform菜單提供了變量級別的數(shù)據(jù)管理,可以對變量進行操作。重慶交通大學管理學院7/12/20221:21:21計算新變量(Compute):最常用變量轉換Recode:對變量值進行分組合并

Visual

Bander:連續(xù)變量的可視化分段Count:表示某個變量的取值中是否出現(xiàn)某個值,或某個區(qū)間Rank

Cases:變量編秩Automatic

Recode:對記錄按某個變量值的大小排序重慶交通大學管理學院7/12/20221:21:21變量級別的數(shù)據(jù)管理(2)Create

Time

Series:建立時間序列Replace

Missing

Values:缺失值替代Random

Number

Seed:設定隨機種子·

專用過程變量級別的數(shù)據(jù)管理(3)·

控制命令Run

Pending

Transforms:用于執(zhí)行編程中被掛起的數(shù)據(jù)整理操作專用于時間序列模型重慶交通大學管理學院7/12/20221:21:21例1數(shù)據(jù)fee.sav是上海和杭州16名住院病人的費用數(shù)據(jù),計算上海的住院病人平均每天的住院費用,要求結果取整。計算新變量重慶交通大學管理學院7/12/20221:21:21輸入新變量名perfee計算新變量重慶交通大學管理學院7/12/20221:21:21計算新變量輸入條件表達式重慶交通大學管理學院7/12/20221:21:21計算新變量選擇函數(shù)輸入函數(shù)表達式重慶交通大學管理學院7/12/20221:21:21計算新變量重慶交通大學管理學院7/12/20221:21:21變量值分組合并例2

在數(shù)據(jù)fee.sav中生成新變量grade,當住院總費用小于5000元時取值為“相對較低”,大于等于5000元且小于7000元取值為“中等”,大于等于7000元且小于10000元為“較高”,大于等于10000元為“很高”。重慶交通大學管理學院7/12/20221:21:21新變量名grade選入原變量total重慶交通大學管理學院7/12/20221:21:21變量值分組合并變量值分組合并重慶交通大學管理學院7/12/20221:21:22·

三種Range的設置,所有的范圍均包含了端點,而前面設定的變換會優(yōu)于后面的變換,因此應該將大于等于10000元最先設定,而將小于5000元最后設定。重慶交通大學管理學院7/12/20221:21:22變量值分組合并變量值分組合并重慶交通大學管理學院7/12/20221:21:22變量值分組合并重慶交通大學管理學院7/12/20221:21:22變量值分組合并重慶交通大學管理學院7/12/20221:21:22務必選上該項變量值分組合并重慶交通大學管理學院7/12/20221:21:22變量值分組合并重慶交通大學管理學院7/12/20221:21:22recode過程提供了精確分組的功能,但如果希望進行的分組是有規(guī)律的,比如等距分組,或等樣本量分組,使用recode過程進行操作就顯得非常麻煩,且可視化程度不高。此時可以考慮使用visual

bander過程進行可視化分段。連續(xù)變量的可視化分段重慶交通大學管理學院7/12/20221:21:22連續(xù)變量的可視化分段例3

仍以數(shù)據(jù)fee.sav為例,按變量total將病人分為5組,5000元以下為第一組,5000元以上的按等間距的方式分4組。重慶交通大學管理學院7/12/20221:21:22連續(xù)變量的可視化分段重慶交通大學管理學院7/12/20221:21:22連續(xù)變量的可視化分段重慶交通大學管理學院7/12/20221:21:22設定分段規(guī)則連續(xù)變量的可視化分段重慶交通大學管理學院7/12/20221:21:22連續(xù)變量的可視化分段自動填充值標簽重慶交通大學管理學院7/12/20221:21:22連續(xù)變量的可視化分段重慶交通大學管理學院7/12/20221:21:22例4

仍以數(shù)據(jù)fee.sav為例,查看變量total中是否出現(xiàn)值6890。查看特定變量值重慶交通大學管理學院7/12/20221:21:22查看特定變量值重慶交通大學管理學院7/12/20221:21:22查看特定變量值重慶交通大學管理學院7/12/20221:21:22查看特定變量值重慶交通大學管理學院7/12/20221:21:22查看特定變量值重慶交通大學管理學院7/12/20221:21:22變量編秩例5仍以數(shù)據(jù)fee.sav為

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論