版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領
文檔簡介
1、羅偉羅偉廣西師范學院教育科學學院廣西師范學院教育科學學院 Email:Email:TelelPSS數(shù)據(jù)處理數(shù)據(jù)處理第二講第二講 SPSS數(shù)據(jù)的預處理數(shù)據(jù)的預處理收集到的數(shù)據(jù)資料在進入正式統(tǒng)計分析之前,收集到的數(shù)據(jù)資料在進入正式統(tǒng)計分析之前,首先要做必要的首先要做必要的預處理預處理,以,以修正、剔除修正、剔除部分部分不合格數(shù)據(jù)不合格數(shù)據(jù),轉換部分數(shù)據(jù);抽取部分樣本,轉換部分數(shù)據(jù);抽取部分樣本參與分析;選取部分變量參與分析等。參與分析;選取部分變量參與分析等。本次課的教學目標本次課的教學目標熟練掌握以下技術:熟練掌握以下技術:數(shù)據(jù)的排序;數(shù)據(jù)的排
2、序;SPSSSPSS文件數(shù)據(jù)的縱向與橫向合并;文件數(shù)據(jù)的縱向與橫向合并;變量計算;變量計算;數(shù)據(jù)選??;數(shù)據(jù)選??;分類匯總;分類匯總;數(shù)據(jù)分組;數(shù)據(jù)分組;數(shù)據(jù)轉置與加權處理;數(shù)據(jù)轉置與加權處理;1、數(shù)據(jù)的排序、數(shù)據(jù)的排序數(shù)據(jù)排序的作用數(shù)據(jù)排序的作用便于數(shù)據(jù)瀏覽,了解數(shù)據(jù)取值狀況,缺失值數(shù)量便于數(shù)據(jù)瀏覽,了解數(shù)據(jù)取值狀況,缺失值數(shù)量多少等;多少等;快捷找到最大值、最小值,計算出全距,初步了快捷找到最大值、最小值,計算出全距,初步了解數(shù)據(jù)離散程度;解數(shù)據(jù)離散程度;快捷發(fā)現(xiàn)異常值??旖莅l(fā)現(xiàn)異常值。數(shù)據(jù)的排序數(shù)據(jù)的排序單值排序與多重排序單值排序與多重排序單值排序:排序變量只有一個單值排序:排序變量只有一
3、個多重排序:排序變量有多個多重排序:排序變量有多個 多重排序時,數(shù)據(jù)首先按主排序變量值的大多重排序時,數(shù)據(jù)首先按主排序變量值的大小次序排序,然后對那些具有相同主排序變量值小次序排序,然后對那些具有相同主排序變量值的數(shù)據(jù),再按照第二排序變量值的次序排序,依的數(shù)據(jù),再按照第二排序變量值的次序排序,依此類推。此類推。數(shù)據(jù)的排序數(shù)據(jù)的排序數(shù)據(jù)排序的基本操作數(shù)據(jù)排序的基本操作Data-Sort Cases說明:說明:1 1,數(shù)據(jù)排序是整行數(shù)據(jù)排序,而不是只對某列,數(shù)據(jù)排序是整行數(shù)據(jù)排序,而不是只對某列變量排序變量排序2 2,多重排序中指定排序變量的次序很關鍵,可,多重排序中指定排序變量的次序很關鍵,可以
4、在按某個變量值升序的同時,再按其他變量值以在按某個變量值升序的同時,再按其他變量值的降序排列。的降序排列。3 3,數(shù)據(jù)排序后,原有排列次序必然被打亂,注,數(shù)據(jù)排序后,原有排列次序必然被打亂,注意保留數(shù)據(jù)原始排列順序。意保留數(shù)據(jù)原始排列順序。練習時間練習時間 ,可練習數(shù)可練習數(shù)a2-2,a2-2,其他數(shù)據(jù)其他數(shù)據(jù)亦可。亦可。2、SPSS數(shù)據(jù)文件的合并數(shù)據(jù)文件的合并縱向合并:縱向合并:Data-Merge File-Add Cases 為為方便方便SPSSSPSS數(shù)據(jù)文件的縱向合并,不同數(shù)據(jù)數(shù)據(jù)文件的縱向合并,不同數(shù)據(jù)文件中數(shù)據(jù)含義相同的數(shù)據(jù)項,最好起相同文件中數(shù)據(jù)含義相同的數(shù)據(jù)項,最好起相同的變
5、量名,且數(shù)據(jù)類型也最好相同,這樣將的變量名,且數(shù)據(jù)類型也最好相同,這樣將大大簡化操作過程中的參數(shù)的選擇,利于大大簡化操作過程中的參數(shù)的選擇,利于SPSSSPSS對變量的自動匹配。含義不同的數(shù)據(jù)項對變量的自動匹配。含義不同的數(shù)據(jù)項其變量名最好不要同名,否則會給數(shù)據(jù)合并其變量名最好不要同名,否則會給數(shù)據(jù)合并過程帶來許多麻煩。過程帶來許多麻煩。SPSS數(shù)據(jù)文件的合并數(shù)據(jù)文件的合并橫向合并橫向合并Data-Merge File-Add VariablesData-Merge File-Add Variables注意:第一,兩個數(shù)據(jù)必須至少有一個名稱相同的變量,該變量是兩個數(shù)據(jù)文件橫向拼接的依據(jù),稱為關
6、鍵變量,如職工號、商品代號等。第二,兩個數(shù)據(jù)文件都必須事先按照關鍵變量進行升序排序第三,為方便SPSS數(shù)據(jù)文件的橫向合并,不同數(shù)據(jù)文件中數(shù)據(jù)含義不相同的數(shù)據(jù)項,變量名不應相同。橫向合并橫向合并Both files provide cases指合并后的數(shù)據(jù)由原來指合并后的數(shù)據(jù)由原來兩個數(shù)據(jù)文件共同提供兩個數(shù)據(jù)文件共同提供,即由原來兩個數(shù)據(jù)文件中的即由原來兩個數(shù)據(jù)文件中的個案共同組成合并后的數(shù)據(jù)文件個案共同組成合并后的數(shù)據(jù)文件;External file is keyed table指在數(shù)據(jù)編輯窗口數(shù)指在數(shù)據(jù)編輯窗口數(shù)據(jù)基礎上,將第二個數(shù)據(jù)文件中的其他變量合并進據(jù)基礎上,將第二個數(shù)據(jù)文件中的其他變
7、量合并進來來,即合并后數(shù)據(jù)文件中的個案僅是當前數(shù)據(jù)編輯窗即合并后數(shù)據(jù)文件中的個案僅是當前數(shù)據(jù)編輯窗口中的個案口中的個案;Working data file is keyed table指在第二個數(shù)據(jù)指在第二個數(shù)據(jù)文件基礎上文件基礎上,將數(shù)據(jù)編輯窗口中的其他變量合并進來將數(shù)據(jù)編輯窗口中的其他變量合并進來,即合并后數(shù)據(jù)文件中的個案僅是第二個數(shù)據(jù)文件中即合并后數(shù)據(jù)文件中的個案僅是第二個數(shù)據(jù)文件中的個案的個案.練習時間 ,練習,練習a2-1a2-1和和a2-2a2-23、變量計算、變量計算數(shù)據(jù)轉換處理數(shù)據(jù)轉換處理轉換數(shù)據(jù)的原有分布轉換數(shù)據(jù)的原有分布SPSS變量計算是在原有數(shù)據(jù)的基礎上,根變量計算是在原
8、有數(shù)據(jù)的基礎上,根據(jù)用戶給出的據(jù)用戶給出的SPSS算術表達式以及函數(shù),算術表達式以及函數(shù),對所有個案或滿足條件的部分個案,計算產(chǎn)對所有個案或滿足條件的部分個案,計算產(chǎn)生一系列新變量。生一系列新變量。變量計算算術表達式算術表達式由常量、變量、算術運算符(由常量、變量、算術運算符(+、/、)、圓括號、函數(shù)等組成的式子)、圓括號、函數(shù)等組成的式子如:如:“平均成績平均成績”(語文(語文+數(shù)學)數(shù)學)/2變量計算變量計算條件表達式:條件表達式: 簡單條件表達式:由關系運算符(、簡單條件表達式:由關系運算符(、)、常量、變量以及算術表達式等組成的式子。)、常量、變量以及算術表達式等組成的式子。如:如:n
9、l 35 表示年齡大于表示年齡大于35歲。歲。 復合條件表達式:復合條件表達式: 又稱邏輯表達式,是由邏輯運算符(又稱邏輯表達式,是由邏輯運算符(&或或and; | 或或or;或或not )、圓括號和簡單條件表達式等組成的式子。)、圓括號和簡單條件表達式等組成的式子。 如:(如:(nl 35)and not (zc 3) 表示年齡小于等于表示年齡小于等于35歲并且職稱不低于歲并且職稱不低于3。變量計算SPSS函數(shù)函數(shù)變量計算的基本操作變量計算的基本操作Transform-Compute如果用戶希望對符合一定條件的個案進行變?nèi)绻脩粝M麑Ψ弦欢l件的個案進行變量計算,則單擊量計算,則單
10、擊 if按鈕,選擇按鈕,選擇“Include if case satisfies condition”應用舉例應用舉例“平均成績平均成績”(語文(語文+數(shù)學)數(shù)學)/2“平均成績平均成績”(語文(語文+數(shù)學)數(shù)學)/2 if 年齡年齡=16練習時間1 1、以、以“nvp”為變量名計算為變量名計算“性別性別” 為為“女女”的學生的的學生的“平均成績平均成績”。2 2、計算性別為、計算性別為“男男”并且并且“年齡年齡”為為1616歲以歲以上的同學的平均成績。上的同學的平均成績。4、數(shù)據(jù)選取、數(shù)據(jù)選取數(shù)據(jù)選取:數(shù)據(jù)選?。焊鶕?jù)分析的需要,從已收集到的大批量數(shù)據(jù)(總體)根據(jù)分析的需要,從已收集到的大批量
11、數(shù)據(jù)(總體)中按照一定的規(guī)則抽取部分數(shù)據(jù)(樣本)參與分析中按照一定的規(guī)則抽取部分數(shù)據(jù)(樣本)參與分析的過程,通常也稱為樣本抽樣。的過程,通常也稱為樣本抽樣??梢蕴岣邤?shù)據(jù)分析效率可以提高數(shù)據(jù)分析效率可以把抽取的數(shù)據(jù)用于建模,剩余的數(shù)據(jù)用于檢驗可以把抽取的數(shù)據(jù)用于建模,剩余的數(shù)據(jù)用于檢驗模型模型一旦數(shù)據(jù)被選取后,后面的分析操作只針對選出的一旦數(shù)據(jù)被選取后,后面的分析操作只針對選出的數(shù)據(jù)進行,直到用戶取消這種選取為止。數(shù)據(jù)進行,直到用戶取消這種選取為止。數(shù)據(jù)選取數(shù)據(jù)選取Data-select cases數(shù)據(jù)選取數(shù)據(jù)選取的基本方式數(shù)據(jù)選取的基本方式1,按指定條件選取。,按指定條件選取。If condi
12、tion is satistiedUnselected cases are Filtered deleted2,隨機抽樣:,隨機抽樣:Random sample of cases近似抽樣近似抽樣Approximately _%of all cases精確抽樣精確抽樣Exactly_cases from the first _ cases3、選取某一區(qū)域內(nèi)的樣本、選取某一區(qū)域內(nèi)的樣本Based on time or case range4、通過過濾器選取樣本、通過過濾器選取樣本Use filter variable要求制定一個變量作為過濾變量。變量值為要求制定一個變量作為過濾變量。變量值為非非0
13、或非系統(tǒng)缺失值的個案將被選中?;蚍窍到y(tǒng)缺失值的個案將被選中。數(shù)據(jù)選取練習練習一:把練習一:把a3中中 “ 性別為女性性別為女性” 個案數(shù)據(jù)選個案數(shù)據(jù)選取出來。取出來。練習二:把練習二:把“語文成績語文成績80分以上分以上” 個案數(shù)據(jù)選個案數(shù)據(jù)選取出來。取出來。練習三:把練習三:把“年齡是年齡是16歲歲”個案數(shù)據(jù)選取出來。個案數(shù)據(jù)選取出來。5、分類匯總、分類匯總分類匯總:分類匯總:按照某分類進行匯總計算。按照某分類進行匯總計算。SPSS實現(xiàn)分類匯總涉及兩個主要方面實現(xiàn)分類匯總涉及兩個主要方面按照哪個變量進行分類按照哪個變量進行分類對哪個變量進行匯總,并指定對匯總變量計對哪個變量進行匯總,并指定對
14、匯總變量計算哪些統(tǒng)計量。算哪些統(tǒng)計量。分類匯總分類匯總基本操作分類匯總基本操作Data-Aggregate多重分類匯總多重分類匯總應用舉例應用舉例將將a3中年齡作為分組變量,計算語文、數(shù)學中年齡作為分組變量,計算語文、數(shù)學的均值。的均值。分類匯總練習將將a3中性別作為分組變量,計算語文、數(shù)學中性別作為分組變量,計算語文、數(shù)學的均值。的均值。6、數(shù)據(jù)分組、數(shù)據(jù)分組數(shù)據(jù)分組:數(shù)據(jù)分組:根據(jù)統(tǒng)計研究的需要,將數(shù)據(jù)按照某種標準根據(jù)統(tǒng)計研究的需要,將數(shù)據(jù)按照某種標準重新劃分為不同的組別。重新劃分為不同的組別。1)組距分組)組距分組2)分位數(shù)分組)分位數(shù)分組數(shù)據(jù)分組數(shù)據(jù)分組1)組距分組:)組距分組:Tra
15、nsform- Recorde確定分組數(shù)的經(jīng)驗公式:確定分組數(shù)的經(jīng)驗公式:K=1+(lgn/lg2)作為實際中的參考作為實際中的參考(1)指定分組變量)指定分組變量(2)定義分組區(qū)間:)定義分組區(qū)間:不重不漏不重不漏(3)指定存放分組結果的變量)指定存放分組結果的變量7、數(shù)據(jù)轉置、數(shù)據(jù)轉置數(shù)據(jù)轉置數(shù)據(jù)轉置Data - Transpose應選擇一個取值唯一的變量(如職工號)作應選擇一個取值唯一的變量(如職工號)作為標記變量并放到為標記變量并放到Name Variable框中??蛑小@喊牙喊选癮3-1”文檔中的數(shù)據(jù)轉置。文檔中的數(shù)據(jù)轉置。練習將其他數(shù)據(jù)轉置。將其他數(shù)據(jù)轉置。3.7 數(shù)據(jù)加權數(shù)據(jù)加權計算某天菜市場蔬菜銷售的平均價格,不可計算某天菜市場蔬菜銷售的平均價格,不可以用各種蔬菜銷售價格的平均值,還應該考以用各種蔬菜銷售價格的平均值,還應該考慮每種蔬菜的銷售量。慮每種蔬菜的銷售量。加權處理:加權處理:Data-Weight Cases一旦指定加權,以后分析中加權一直有效直一旦指定加權,以后分析中加權一直有效直到取消加權為止。
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2024國際貨物買賣合同CIF術語
- 2024天津市勞動合同范本
- 2024裝飾工程勞務分包標準合同
- 2024年度企業(yè)管理系統(tǒng)升級合同
- 2024年企業(yè)咨詢服務提供合同
- 2024年度安置房買賣合同中的交易過程監(jiān)督
- 2024企業(yè)間貸款合同范文
- 2024建材訂貨合同范文
- 2024年度安徽省某地行政中心建筑施工合同
- 2024年度廣告制作合同:某廣告公司對客戶的廣告制作及標的廣告創(chuàng)意要求
- 《一元二次方程》(復習課)說課稿
- 律師事務所金融業(yè)務部法律服務方案
- 施工人員計劃配置表(共1頁)
- 裝修工程施工進度計劃表excel模板
- 發(fā)電機組自動控制器
- 宿舍管理流程圖
- 骨科復試問答題
- 新版慢病隨訪表3頁
- 《實踐論》讀書PPT課件
- 青島版科學六年級上冊《齒輪》教學設計
- 《偷影子的人》PPT課件
評論
0/150
提交評論