SPSS數(shù)據(jù)處理 第二講_第1頁(yè)
SPSS數(shù)據(jù)處理 第二講_第2頁(yè)
SPSS數(shù)據(jù)處理 第二講_第3頁(yè)
SPSS數(shù)據(jù)處理 第二講_第4頁(yè)
SPSS數(shù)據(jù)處理 第二講_第5頁(yè)
已閱讀5頁(yè),還剩29頁(yè)未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、羅偉羅偉廣西師范學(xué)院教育科學(xué)學(xué)院廣西師范學(xué)院教育科學(xué)學(xué)院 Email:Email:TelelPSS數(shù)據(jù)處理數(shù)據(jù)處理第二講第二講 SPSS數(shù)據(jù)的預(yù)處理數(shù)據(jù)的預(yù)處理收集到的數(shù)據(jù)資料在進(jìn)入正式統(tǒng)計(jì)分析之前,收集到的數(shù)據(jù)資料在進(jìn)入正式統(tǒng)計(jì)分析之前,首先要做必要的首先要做必要的預(yù)處理預(yù)處理,以,以修正、剔除修正、剔除部分部分不合格數(shù)據(jù)不合格數(shù)據(jù),轉(zhuǎn)換部分?jǐn)?shù)據(jù);抽取部分樣本,轉(zhuǎn)換部分?jǐn)?shù)據(jù);抽取部分樣本參與分析;選取部分變量參與分析等。參與分析;選取部分變量參與分析等。本次課的教學(xué)目標(biāo)本次課的教學(xué)目標(biāo)熟練掌握以下技術(shù):熟練掌握以下技術(shù):數(shù)據(jù)的排序;數(shù)據(jù)的排

2、序;SPSSSPSS文件數(shù)據(jù)的縱向與橫向合并;文件數(shù)據(jù)的縱向與橫向合并;變量計(jì)算;變量計(jì)算;數(shù)據(jù)選??;數(shù)據(jù)選??;分類匯總;分類匯總;數(shù)據(jù)分組;數(shù)據(jù)分組;數(shù)據(jù)轉(zhuǎn)置與加權(quán)處理;數(shù)據(jù)轉(zhuǎn)置與加權(quán)處理;1、數(shù)據(jù)的排序、數(shù)據(jù)的排序數(shù)據(jù)排序的作用數(shù)據(jù)排序的作用便于數(shù)據(jù)瀏覽,了解數(shù)據(jù)取值狀況,缺失值數(shù)量便于數(shù)據(jù)瀏覽,了解數(shù)據(jù)取值狀況,缺失值數(shù)量多少等;多少等;快捷找到最大值、最小值,計(jì)算出全距,初步了快捷找到最大值、最小值,計(jì)算出全距,初步了解數(shù)據(jù)離散程度;解數(shù)據(jù)離散程度;快捷發(fā)現(xiàn)異常值??旖莅l(fā)現(xiàn)異常值。數(shù)據(jù)的排序數(shù)據(jù)的排序單值排序與多重排序單值排序與多重排序單值排序:排序變量只有一個(gè)單值排序:排序變量只有一

3、個(gè)多重排序:排序變量有多個(gè)多重排序:排序變量有多個(gè) 多重排序時(shí),數(shù)據(jù)首先按主排序變量值的大多重排序時(shí),數(shù)據(jù)首先按主排序變量值的大小次序排序,然后對(duì)那些具有相同主排序變量值小次序排序,然后對(duì)那些具有相同主排序變量值的數(shù)據(jù),再按照第二排序變量值的次序排序,依的數(shù)據(jù),再按照第二排序變量值的次序排序,依此類推。此類推。數(shù)據(jù)的排序數(shù)據(jù)的排序數(shù)據(jù)排序的基本操作數(shù)據(jù)排序的基本操作Data-Sort Cases說(shuō)明:說(shuō)明:1 1,數(shù)據(jù)排序是整行數(shù)據(jù)排序,而不是只對(duì)某列,數(shù)據(jù)排序是整行數(shù)據(jù)排序,而不是只對(duì)某列變量排序變量排序2 2,多重排序中指定排序變量的次序很關(guān)鍵,可,多重排序中指定排序變量的次序很關(guān)鍵,可以

4、在按某個(gè)變量值升序的同時(shí),再按其他變量值以在按某個(gè)變量值升序的同時(shí),再按其他變量值的降序排列。的降序排列。3 3,數(shù)據(jù)排序后,原有排列次序必然被打亂,注,數(shù)據(jù)排序后,原有排列次序必然被打亂,注意保留數(shù)據(jù)原始排列順序。意保留數(shù)據(jù)原始排列順序。練習(xí)時(shí)間練習(xí)時(shí)間 ,可練習(xí)數(shù)可練習(xí)數(shù)a2-2,a2-2,其他數(shù)據(jù)其他數(shù)據(jù)亦可。亦可。2、SPSS數(shù)據(jù)文件的合并數(shù)據(jù)文件的合并縱向合并:縱向合并:Data-Merge File-Add Cases 為為方便方便SPSSSPSS數(shù)據(jù)文件的縱向合并,不同數(shù)據(jù)數(shù)據(jù)文件的縱向合并,不同數(shù)據(jù)文件中數(shù)據(jù)含義相同的數(shù)據(jù)項(xiàng),最好起相同文件中數(shù)據(jù)含義相同的數(shù)據(jù)項(xiàng),最好起相同的變

5、量名,且數(shù)據(jù)類型也最好相同,這樣將的變量名,且數(shù)據(jù)類型也最好相同,這樣將大大簡(jiǎn)化操作過(guò)程中的參數(shù)的選擇,利于大大簡(jiǎn)化操作過(guò)程中的參數(shù)的選擇,利于SPSSSPSS對(duì)變量的自動(dòng)匹配。含義不同的數(shù)據(jù)項(xiàng)對(duì)變量的自動(dòng)匹配。含義不同的數(shù)據(jù)項(xiàng)其變量名最好不要同名,否則會(huì)給數(shù)據(jù)合并其變量名最好不要同名,否則會(huì)給數(shù)據(jù)合并過(guò)程帶來(lái)許多麻煩。過(guò)程帶來(lái)許多麻煩。SPSS數(shù)據(jù)文件的合并數(shù)據(jù)文件的合并橫向合并橫向合并Data-Merge File-Add VariablesData-Merge File-Add Variables注意:第一,兩個(gè)數(shù)據(jù)必須至少有一個(gè)名稱相同的變量,該變量是兩個(gè)數(shù)據(jù)文件橫向拼接的依據(jù),稱為關(guān)

6、鍵變量,如職工號(hào)、商品代號(hào)等。第二,兩個(gè)數(shù)據(jù)文件都必須事先按照關(guān)鍵變量進(jìn)行升序排序第三,為方便SPSS數(shù)據(jù)文件的橫向合并,不同數(shù)據(jù)文件中數(shù)據(jù)含義不相同的數(shù)據(jù)項(xiàng),變量名不應(yīng)相同。橫向合并橫向合并Both files provide cases指合并后的數(shù)據(jù)由原來(lái)指合并后的數(shù)據(jù)由原來(lái)兩個(gè)數(shù)據(jù)文件共同提供兩個(gè)數(shù)據(jù)文件共同提供,即由原來(lái)兩個(gè)數(shù)據(jù)文件中的即由原來(lái)兩個(gè)數(shù)據(jù)文件中的個(gè)案共同組成合并后的數(shù)據(jù)文件個(gè)案共同組成合并后的數(shù)據(jù)文件;External file is keyed table指在數(shù)據(jù)編輯窗口數(shù)指在數(shù)據(jù)編輯窗口數(shù)據(jù)基礎(chǔ)上,將第二個(gè)數(shù)據(jù)文件中的其他變量合并進(jìn)據(jù)基礎(chǔ)上,將第二個(gè)數(shù)據(jù)文件中的其他變

7、量合并進(jìn)來(lái)來(lái),即合并后數(shù)據(jù)文件中的個(gè)案僅是當(dāng)前數(shù)據(jù)編輯窗即合并后數(shù)據(jù)文件中的個(gè)案僅是當(dāng)前數(shù)據(jù)編輯窗口中的個(gè)案口中的個(gè)案;Working data file is keyed table指在第二個(gè)數(shù)據(jù)指在第二個(gè)數(shù)據(jù)文件基礎(chǔ)上文件基礎(chǔ)上,將數(shù)據(jù)編輯窗口中的其他變量合并進(jìn)來(lái)將數(shù)據(jù)編輯窗口中的其他變量合并進(jìn)來(lái),即合并后數(shù)據(jù)文件中的個(gè)案僅是第二個(gè)數(shù)據(jù)文件中即合并后數(shù)據(jù)文件中的個(gè)案僅是第二個(gè)數(shù)據(jù)文件中的個(gè)案的個(gè)案.練習(xí)時(shí)間 ,練習(xí),練習(xí)a2-1a2-1和和a2-2a2-23、變量計(jì)算、變量計(jì)算數(shù)據(jù)轉(zhuǎn)換處理數(shù)據(jù)轉(zhuǎn)換處理轉(zhuǎn)換數(shù)據(jù)的原有分布轉(zhuǎn)換數(shù)據(jù)的原有分布SPSS變量計(jì)算是在原有數(shù)據(jù)的基礎(chǔ)上,根變量計(jì)算是在原

8、有數(shù)據(jù)的基礎(chǔ)上,根據(jù)用戶給出的據(jù)用戶給出的SPSS算術(shù)表達(dá)式以及函數(shù),算術(shù)表達(dá)式以及函數(shù),對(duì)所有個(gè)案或滿足條件的部分個(gè)案,計(jì)算產(chǎn)對(duì)所有個(gè)案或滿足條件的部分個(gè)案,計(jì)算產(chǎn)生一系列新變量。生一系列新變量。變量計(jì)算算術(shù)表達(dá)式算術(shù)表達(dá)式由常量、變量、算術(shù)運(yùn)算符(由常量、變量、算術(shù)運(yùn)算符(+、/、)、圓括號(hào)、函數(shù)等組成的式子)、圓括號(hào)、函數(shù)等組成的式子如:如:“平均成績(jī)平均成績(jī)”(語(yǔ)文(語(yǔ)文+數(shù)學(xué))數(shù)學(xué))/2變量計(jì)算變量計(jì)算條件表達(dá)式:條件表達(dá)式: 簡(jiǎn)單條件表達(dá)式:由關(guān)系運(yùn)算符(、簡(jiǎn)單條件表達(dá)式:由關(guān)系運(yùn)算符(、)、常量、變量以及算術(shù)表達(dá)式等組成的式子。)、常量、變量以及算術(shù)表達(dá)式等組成的式子。如:如:n

9、l 35 表示年齡大于表示年齡大于35歲。歲。 復(fù)合條件表達(dá)式:復(fù)合條件表達(dá)式: 又稱邏輯表達(dá)式,是由邏輯運(yùn)算符(又稱邏輯表達(dá)式,是由邏輯運(yùn)算符(&或或and; | 或或or;或或not )、圓括號(hào)和簡(jiǎn)單條件表達(dá)式等組成的式子。)、圓括號(hào)和簡(jiǎn)單條件表達(dá)式等組成的式子。 如:(如:(nl 35)and not (zc 3) 表示年齡小于等于表示年齡小于等于35歲并且職稱不低于歲并且職稱不低于3。變量計(jì)算SPSS函數(shù)函數(shù)變量計(jì)算的基本操作變量計(jì)算的基本操作Transform-Compute如果用戶希望對(duì)符合一定條件的個(gè)案進(jìn)行變?nèi)绻脩粝M麑?duì)符合一定條件的個(gè)案進(jìn)行變量計(jì)算,則單擊量計(jì)算,則單

10、擊 if按鈕,選擇按鈕,選擇“Include if case satisfies condition”應(yīng)用舉例應(yīng)用舉例“平均成績(jī)平均成績(jī)”(語(yǔ)文(語(yǔ)文+數(shù)學(xué))數(shù)學(xué))/2“平均成績(jī)平均成績(jī)”(語(yǔ)文(語(yǔ)文+數(shù)學(xué))數(shù)學(xué))/2 if 年齡年齡=16練習(xí)時(shí)間1 1、以、以“nvp”為變量名計(jì)算為變量名計(jì)算“性別性別” 為為“女女”的學(xué)生的的學(xué)生的“平均成績(jī)平均成績(jī)”。2 2、計(jì)算性別為、計(jì)算性別為“男男”并且并且“年齡年齡”為為1616歲以歲以上的同學(xué)的平均成績(jī)。上的同學(xué)的平均成績(jī)。4、數(shù)據(jù)選取、數(shù)據(jù)選取數(shù)據(jù)選取:數(shù)據(jù)選?。焊鶕?jù)分析的需要,從已收集到的大批量數(shù)據(jù)(總體)根據(jù)分析的需要,從已收集到的大批量

11、數(shù)據(jù)(總體)中按照一定的規(guī)則抽取部分?jǐn)?shù)據(jù)(樣本)參與分析中按照一定的規(guī)則抽取部分?jǐn)?shù)據(jù)(樣本)參與分析的過(guò)程,通常也稱為樣本抽樣。的過(guò)程,通常也稱為樣本抽樣??梢蕴岣邤?shù)據(jù)分析效率可以提高數(shù)據(jù)分析效率可以把抽取的數(shù)據(jù)用于建模,剩余的數(shù)據(jù)用于檢驗(yàn)可以把抽取的數(shù)據(jù)用于建模,剩余的數(shù)據(jù)用于檢驗(yàn)?zāi)P湍P鸵坏?shù)據(jù)被選取后,后面的分析操作只針對(duì)選出的一旦數(shù)據(jù)被選取后,后面的分析操作只針對(duì)選出的數(shù)據(jù)進(jìn)行,直到用戶取消這種選取為止。數(shù)據(jù)進(jìn)行,直到用戶取消這種選取為止。數(shù)據(jù)選取數(shù)據(jù)選取Data-select cases數(shù)據(jù)選取數(shù)據(jù)選取的基本方式數(shù)據(jù)選取的基本方式1,按指定條件選取。,按指定條件選取。If condi

12、tion is satistiedUnselected cases are Filtered deleted2,隨機(jī)抽樣:,隨機(jī)抽樣:Random sample of cases近似抽樣近似抽樣Approximately _%of all cases精確抽樣精確抽樣Exactly_cases from the first _ cases3、選取某一區(qū)域內(nèi)的樣本、選取某一區(qū)域內(nèi)的樣本Based on time or case range4、通過(guò)過(guò)濾器選取樣本、通過(guò)過(guò)濾器選取樣本Use filter variable要求制定一個(gè)變量作為過(guò)濾變量。變量值為要求制定一個(gè)變量作為過(guò)濾變量。變量值為非非0

13、或非系統(tǒng)缺失值的個(gè)案將被選中?;蚍窍到y(tǒng)缺失值的個(gè)案將被選中。數(shù)據(jù)選取練習(xí)練習(xí)一:把練習(xí)一:把a(bǔ)3中中 “ 性別為女性性別為女性” 個(gè)案數(shù)據(jù)選個(gè)案數(shù)據(jù)選取出來(lái)。取出來(lái)。練習(xí)二:把練習(xí)二:把“語(yǔ)文成績(jī)語(yǔ)文成績(jī)80分以上分以上” 個(gè)案數(shù)據(jù)選個(gè)案數(shù)據(jù)選取出來(lái)。取出來(lái)。練習(xí)三:把練習(xí)三:把“年齡是年齡是16歲歲”個(gè)案數(shù)據(jù)選取出來(lái)。個(gè)案數(shù)據(jù)選取出來(lái)。5、分類匯總、分類匯總分類匯總:分類匯總:按照某分類進(jìn)行匯總計(jì)算。按照某分類進(jìn)行匯總計(jì)算。SPSS實(shí)現(xiàn)分類匯總涉及兩個(gè)主要方面實(shí)現(xiàn)分類匯總涉及兩個(gè)主要方面按照哪個(gè)變量進(jìn)行分類按照哪個(gè)變量進(jìn)行分類對(duì)哪個(gè)變量進(jìn)行匯總,并指定對(duì)匯總變量計(jì)對(duì)哪個(gè)變量進(jìn)行匯總,并指定對(duì)

14、匯總變量計(jì)算哪些統(tǒng)計(jì)量。算哪些統(tǒng)計(jì)量。分類匯總分類匯總基本操作分類匯總基本操作Data-Aggregate多重分類匯總多重分類匯總應(yīng)用舉例應(yīng)用舉例將將a3中年齡作為分組變量,計(jì)算語(yǔ)文、數(shù)學(xué)中年齡作為分組變量,計(jì)算語(yǔ)文、數(shù)學(xué)的均值。的均值。分類匯總練習(xí)將將a3中性別作為分組變量,計(jì)算語(yǔ)文、數(shù)學(xué)中性別作為分組變量,計(jì)算語(yǔ)文、數(shù)學(xué)的均值。的均值。6、數(shù)據(jù)分組、數(shù)據(jù)分組數(shù)據(jù)分組:數(shù)據(jù)分組:根據(jù)統(tǒng)計(jì)研究的需要,將數(shù)據(jù)按照某種標(biāo)準(zhǔn)根據(jù)統(tǒng)計(jì)研究的需要,將數(shù)據(jù)按照某種標(biāo)準(zhǔn)重新劃分為不同的組別。重新劃分為不同的組別。1)組距分組)組距分組2)分位數(shù)分組)分位數(shù)分組數(shù)據(jù)分組數(shù)據(jù)分組1)組距分組:)組距分組:Tra

15、nsform- Recorde確定分組數(shù)的經(jīng)驗(yàn)公式:確定分組數(shù)的經(jīng)驗(yàn)公式:K=1+(lgn/lg2)作為實(shí)際中的參考作為實(shí)際中的參考(1)指定分組變量)指定分組變量(2)定義分組區(qū)間:)定義分組區(qū)間:不重不漏不重不漏(3)指定存放分組結(jié)果的變量)指定存放分組結(jié)果的變量7、數(shù)據(jù)轉(zhuǎn)置、數(shù)據(jù)轉(zhuǎn)置數(shù)據(jù)轉(zhuǎn)置數(shù)據(jù)轉(zhuǎn)置Data - Transpose應(yīng)選擇一個(gè)取值唯一的變量(如職工號(hào))作應(yīng)選擇一個(gè)取值唯一的變量(如職工號(hào))作為標(biāo)記變量并放到為標(biāo)記變量并放到Name Variable框中??蛑小@喊牙喊选癮3-1”文檔中的數(shù)據(jù)轉(zhuǎn)置。文檔中的數(shù)據(jù)轉(zhuǎn)置。練習(xí)將其他數(shù)據(jù)轉(zhuǎn)置。將其他數(shù)據(jù)轉(zhuǎn)置。3.7 數(shù)據(jù)加權(quán)數(shù)據(jù)加權(quán)計(jì)算某天菜市場(chǎng)蔬菜銷售的平均價(jià)格,不可計(jì)算某天菜市場(chǎng)蔬菜銷售的平均價(jià)格,不可以用各種蔬菜銷售價(jià)格的平均值,還應(yīng)該考以用各種蔬菜銷售價(jià)格的平均值,還應(yīng)該考慮每種蔬菜的銷售量。慮每種蔬菜的銷售量。加權(quán)處理:加權(quán)處理:Data-Weight Cases一旦指定加權(quán),以后分析中加權(quán)一直有效直一旦指定加權(quán),以后分析中加權(quán)一直有效直到取消加權(quán)為止。

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論