SPSS數(shù)據(jù)處理第二講

上傳人：a*** IP屬地：湖北上傳時(shí)間：2022-06-21 格式：PPT 頁(yè)數(shù)：34 大小：487.50KB 積分：28 舉報(bào) 版權(quán)申訴

已閱讀5頁(yè)，還剩29頁(yè)未讀，繼續(xù)免費(fèi)閱讀

版權(quán)說(shuō)明：本文檔由用戶提供并上傳，收益歸屬內(nèi)容提供方，若內(nèi)容存在侵權(quán)，請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、羅偉羅偉廣西師范學(xué)院教育科學(xué)學(xué)院廣西師范學(xué)院教育科學(xué)學(xué)院 Email:Email:TelelPSS數(shù)據(jù)處理數(shù)據(jù)處理第二講第二講 SPSS數(shù)據(jù)的預(yù)處理數(shù)據(jù)的預(yù)處理收集到的數(shù)據(jù)資料在進(jìn)入正式統(tǒng)計(jì)分析之前，收集到的數(shù)據(jù)資料在進(jìn)入正式統(tǒng)計(jì)分析之前，首先要做必要的首先要做必要的預(yù)處理預(yù)處理，以，以修正、剔除修正、剔除部分部分不合格數(shù)據(jù)不合格數(shù)據(jù)，轉(zhuǎn)換部分?jǐn)?shù)據(jù)；抽取部分樣本，轉(zhuǎn)換部分?jǐn)?shù)據(jù)；抽取部分樣本參與分析；選取部分變量參與分析等。參與分析；選取部分變量參與分析等。本次課的教學(xué)目標(biāo)本次課的教學(xué)目標(biāo)熟練掌握以下技術(shù)：熟練掌握以下技術(shù)：數(shù)據(jù)的排序；數(shù)據(jù)的排

2、序；SPSSSPSS文件數(shù)據(jù)的縱向與橫向合并；文件數(shù)據(jù)的縱向與橫向合并；變量計(jì)算；變量計(jì)算；數(shù)據(jù)選?。粩?shù)據(jù)選??；分類匯總；分類匯總；數(shù)據(jù)分組；數(shù)據(jù)分組；數(shù)據(jù)轉(zhuǎn)置與加權(quán)處理；數(shù)據(jù)轉(zhuǎn)置與加權(quán)處理；1、數(shù)據(jù)的排序、數(shù)據(jù)的排序數(shù)據(jù)排序的作用數(shù)據(jù)排序的作用便于數(shù)據(jù)瀏覽，了解數(shù)據(jù)取值狀況，缺失值數(shù)量便于數(shù)據(jù)瀏覽，了解數(shù)據(jù)取值狀況，缺失值數(shù)量多少等；多少等；快捷找到最大值、最小值，計(jì)算出全距，初步了快捷找到最大值、最小值，計(jì)算出全距，初步了解數(shù)據(jù)離散程度；解數(shù)據(jù)離散程度；快捷發(fā)現(xiàn)異常值?？旖莅l(fā)現(xiàn)異常值。數(shù)據(jù)的排序數(shù)據(jù)的排序單值排序與多重排序單值排序與多重排序單值排序：排序變量只有一個(gè)單值排序：排序變量只有一

3、個(gè)多重排序：排序變量有多個(gè)多重排序：排序變量有多個(gè) 多重排序時(shí)，數(shù)據(jù)首先按主排序變量值的大多重排序時(shí)，數(shù)據(jù)首先按主排序變量值的大小次序排序，然后對(duì)那些具有相同主排序變量值小次序排序，然后對(duì)那些具有相同主排序變量值的數(shù)據(jù)，再按照第二排序變量值的次序排序，依的數(shù)據(jù)，再按照第二排序變量值的次序排序，依此類推。此類推。數(shù)據(jù)的排序數(shù)據(jù)的排序數(shù)據(jù)排序的基本操作數(shù)據(jù)排序的基本操作Data-Sort Cases說(shuō)明：說(shuō)明：1 1，數(shù)據(jù)排序是整行數(shù)據(jù)排序，而不是只對(duì)某列，數(shù)據(jù)排序是整行數(shù)據(jù)排序，而不是只對(duì)某列變量排序變量排序2 2，多重排序中指定排序變量的次序很關(guān)鍵，可，多重排序中指定排序變量的次序很關(guān)鍵，可以

4、在按某個(gè)變量值升序的同時(shí)，再按其他變量值以在按某個(gè)變量值升序的同時(shí)，再按其他變量值的降序排列。的降序排列。3 3，數(shù)據(jù)排序后，原有排列次序必然被打亂，注，數(shù)據(jù)排序后，原有排列次序必然被打亂，注意保留數(shù)據(jù)原始排列順序。意保留數(shù)據(jù)原始排列順序。練習(xí)時(shí)間練習(xí)時(shí)間 ,可練習(xí)數(shù)可練習(xí)數(shù)a2-2,a2-2,其他數(shù)據(jù)其他數(shù)據(jù)亦可。亦可。2、SPSS數(shù)據(jù)文件的合并數(shù)據(jù)文件的合并縱向合并：縱向合并：Data-Merge File-Add Cases 為為方便方便SPSSSPSS數(shù)據(jù)文件的縱向合并，不同數(shù)據(jù)數(shù)據(jù)文件的縱向合并，不同數(shù)據(jù)文件中數(shù)據(jù)含義相同的數(shù)據(jù)項(xiàng)，最好起相同文件中數(shù)據(jù)含義相同的數(shù)據(jù)項(xiàng)，最好起相同的變

5、量名，且數(shù)據(jù)類型也最好相同，這樣將的變量名，且數(shù)據(jù)類型也最好相同，這樣將大大簡(jiǎn)化操作過(guò)程中的參數(shù)的選擇，利于大大簡(jiǎn)化操作過(guò)程中的參數(shù)的選擇，利于SPSSSPSS對(duì)變量的自動(dòng)匹配。含義不同的數(shù)據(jù)項(xiàng)對(duì)變量的自動(dòng)匹配。含義不同的數(shù)據(jù)項(xiàng)其變量名最好不要同名，否則會(huì)給數(shù)據(jù)合并其變量名最好不要同名，否則會(huì)給數(shù)據(jù)合并過(guò)程帶來(lái)許多麻煩。過(guò)程帶來(lái)許多麻煩。SPSS數(shù)據(jù)文件的合并數(shù)據(jù)文件的合并橫向合并橫向合并Data-Merge File-Add VariablesData-Merge File-Add Variables注意：第一，兩個(gè)數(shù)據(jù)必須至少有一個(gè)名稱相同的變量，該變量是兩個(gè)數(shù)據(jù)文件橫向拼接的依據(jù)，稱為關(guān)

6、鍵變量，如職工號(hào)、商品代號(hào)等。第二，兩個(gè)數(shù)據(jù)文件都必須事先按照關(guān)鍵變量進(jìn)行升序排序第三，為方便SPSS數(shù)據(jù)文件的橫向合并，不同數(shù)據(jù)文件中數(shù)據(jù)含義不相同的數(shù)據(jù)項(xiàng)，變量名不應(yīng)相同。橫向合并橫向合并Both files provide cases指合并后的數(shù)據(jù)由原來(lái)指合并后的數(shù)據(jù)由原來(lái)兩個(gè)數(shù)據(jù)文件共同提供兩個(gè)數(shù)據(jù)文件共同提供,即由原來(lái)兩個(gè)數(shù)據(jù)文件中的即由原來(lái)兩個(gè)數(shù)據(jù)文件中的個(gè)案共同組成合并后的數(shù)據(jù)文件個(gè)案共同組成合并后的數(shù)據(jù)文件;External file is keyed table指在數(shù)據(jù)編輯窗口數(shù)指在數(shù)據(jù)編輯窗口數(shù)據(jù)基礎(chǔ)上，將第二個(gè)數(shù)據(jù)文件中的其他變量合并進(jìn)據(jù)基礎(chǔ)上，將第二個(gè)數(shù)據(jù)文件中的其他變

7、量合并進(jìn)來(lái)來(lái),即合并后數(shù)據(jù)文件中的個(gè)案僅是當(dāng)前數(shù)據(jù)編輯窗即合并后數(shù)據(jù)文件中的個(gè)案僅是當(dāng)前數(shù)據(jù)編輯窗口中的個(gè)案口中的個(gè)案;Working data file is keyed table指在第二個(gè)數(shù)據(jù)指在第二個(gè)數(shù)據(jù)文件基礎(chǔ)上文件基礎(chǔ)上,將數(shù)據(jù)編輯窗口中的其他變量合并進(jìn)來(lái)將數(shù)據(jù)編輯窗口中的其他變量合并進(jìn)來(lái),即合并后數(shù)據(jù)文件中的個(gè)案僅是第二個(gè)數(shù)據(jù)文件中即合并后數(shù)據(jù)文件中的個(gè)案僅是第二個(gè)數(shù)據(jù)文件中的個(gè)案的個(gè)案.練習(xí)時(shí)間，練習(xí)，練習(xí)a2-1a2-1和和a2-2a2-23、變量計(jì)算、變量計(jì)算數(shù)據(jù)轉(zhuǎn)換處理數(shù)據(jù)轉(zhuǎn)換處理轉(zhuǎn)換數(shù)據(jù)的原有分布轉(zhuǎn)換數(shù)據(jù)的原有分布SPSS變量計(jì)算是在原有數(shù)據(jù)的基礎(chǔ)上，根變量計(jì)算是在原

8、有數(shù)據(jù)的基礎(chǔ)上，根據(jù)用戶給出的據(jù)用戶給出的SPSS算術(shù)表達(dá)式以及函數(shù)，算術(shù)表達(dá)式以及函數(shù)，對(duì)所有個(gè)案或滿足條件的部分個(gè)案，計(jì)算產(chǎn)對(duì)所有個(gè)案或滿足條件的部分個(gè)案，計(jì)算產(chǎn)生一系列新變量。生一系列新變量。變量計(jì)算算術(shù)表達(dá)式算術(shù)表達(dá)式由常量、變量、算術(shù)運(yùn)算符（由常量、變量、算術(shù)運(yùn)算符（+、/、）、圓括號(hào)、函數(shù)等組成的式子）、圓括號(hào)、函數(shù)等組成的式子如：如：“平均成績(jī)平均成績(jī)”（語(yǔ)文（語(yǔ)文+數(shù)學(xué)）數(shù)學(xué)）/2變量計(jì)算變量計(jì)算條件表達(dá)式：條件表達(dá)式：簡(jiǎn)單條件表達(dá)式：由關(guān)系運(yùn)算符（、簡(jiǎn)單條件表達(dá)式：由關(guān)系運(yùn)算符（、）、常量、變量以及算術(shù)表達(dá)式等組成的式子。）、常量、變量以及算術(shù)表達(dá)式等組成的式子。如：如：n

9、l 35 表示年齡大于表示年齡大于35歲。歲。復(fù)合條件表達(dá)式：復(fù)合條件表達(dá)式：又稱邏輯表達(dá)式，是由邏輯運(yùn)算符（又稱邏輯表達(dá)式，是由邏輯運(yùn)算符（&或或and; | 或或or;或或not ）、圓括號(hào)和簡(jiǎn)單條件表達(dá)式等組成的式子。）、圓括號(hào)和簡(jiǎn)單條件表達(dá)式等組成的式子。如：（如：（nl 35）and not (zc 3) 表示年齡小于等于表示年齡小于等于35歲并且職稱不低于歲并且職稱不低于3。變量計(jì)算SPSS函數(shù)函數(shù)變量計(jì)算的基本操作變量計(jì)算的基本操作Transform-Compute如果用戶希望對(duì)符合一定條件的個(gè)案進(jìn)行變?nèi)绻脩粝Ｍ麑?duì)符合一定條件的個(gè)案進(jìn)行變量計(jì)算，則單擊量計(jì)算，則單

10、擊 if按鈕，選擇按鈕，選擇“Include if case satisfies condition”應(yīng)用舉例應(yīng)用舉例“平均成績(jī)平均成績(jī)”（語(yǔ)文（語(yǔ)文+數(shù)學(xué)）數(shù)學(xué)）/2“平均成績(jī)平均成績(jī)”（語(yǔ)文（語(yǔ)文+數(shù)學(xué)）數(shù)學(xué)）/2 if 年齡年齡=16練習(xí)時(shí)間1 1、以、以“nvp”為變量名計(jì)算為變量名計(jì)算“性別性別” 為為“女女”的學(xué)生的的學(xué)生的“平均成績(jī)平均成績(jī)”。2 2、計(jì)算性別為、計(jì)算性別為“男男”并且并且“年齡年齡”為為1616歲以歲以上的同學(xué)的平均成績(jī)。上的同學(xué)的平均成績(jī)。4、數(shù)據(jù)選取、數(shù)據(jù)選取數(shù)據(jù)選?。簲?shù)據(jù)選?。焊鶕?jù)分析的需要，從已收集到的大批量數(shù)據(jù)（總體）根據(jù)分析的需要，從已收集到的大批量

11、數(shù)據(jù)（總體）中按照一定的規(guī)則抽取部分?jǐn)?shù)據(jù)（樣本）參與分析中按照一定的規(guī)則抽取部分?jǐn)?shù)據(jù)（樣本）參與分析的過(guò)程，通常也稱為樣本抽樣。的過(guò)程，通常也稱為樣本抽樣。可以提高數(shù)據(jù)分析效率可以提高數(shù)據(jù)分析效率可以把抽取的數(shù)據(jù)用于建模，剩余的數(shù)據(jù)用于檢驗(yàn)可以把抽取的數(shù)據(jù)用于建模，剩余的數(shù)據(jù)用于檢驗(yàn)?zāi)Ｐ湍Ｐ鸵坏?shù)據(jù)被選取后，后面的分析操作只針對(duì)選出的一旦數(shù)據(jù)被選取后，后面的分析操作只針對(duì)選出的數(shù)據(jù)進(jìn)行，直到用戶取消這種選取為止。數(shù)據(jù)進(jìn)行，直到用戶取消這種選取為止。數(shù)據(jù)選取數(shù)據(jù)選取Data-select cases數(shù)據(jù)選取數(shù)據(jù)選取的基本方式數(shù)據(jù)選取的基本方式1，按指定條件選取。，按指定條件選取。If condi

12、tion is satistiedUnselected cases are Filtered deleted2，隨機(jī)抽樣：，隨機(jī)抽樣：Random sample of cases近似抽樣近似抽樣Approximately _%of all cases精確抽樣精確抽樣Exactly_cases from the first _ cases3、選取某一區(qū)域內(nèi)的樣本、選取某一區(qū)域內(nèi)的樣本Based on time or case range4、通過(guò)過(guò)濾器選取樣本、通過(guò)過(guò)濾器選取樣本Use filter variable要求制定一個(gè)變量作為過(guò)濾變量。變量值為要求制定一個(gè)變量作為過(guò)濾變量。變量值為非非0

13、或非系統(tǒng)缺失值的個(gè)案將被選中?；蚍窍到y(tǒng)缺失值的個(gè)案將被選中。數(shù)據(jù)選取練習(xí)練習(xí)一：把練習(xí)一：把a(bǔ)3中中 “ 性別為女性性別為女性” 個(gè)案數(shù)據(jù)選個(gè)案數(shù)據(jù)選取出來(lái)。取出來(lái)。練習(xí)二：把練習(xí)二：把“語(yǔ)文成績(jī)語(yǔ)文成績(jī)80分以上分以上” 個(gè)案數(shù)據(jù)選個(gè)案數(shù)據(jù)選取出來(lái)。取出來(lái)。練習(xí)三：把練習(xí)三：把“年齡是年齡是16歲歲”個(gè)案數(shù)據(jù)選取出來(lái)。個(gè)案數(shù)據(jù)選取出來(lái)。5、分類匯總、分類匯總分類匯總：分類匯總：按照某分類進(jìn)行匯總計(jì)算。按照某分類進(jìn)行匯總計(jì)算。SPSS實(shí)現(xiàn)分類匯總涉及兩個(gè)主要方面實(shí)現(xiàn)分類匯總涉及兩個(gè)主要方面按照哪個(gè)變量進(jìn)行分類按照哪個(gè)變量進(jìn)行分類對(duì)哪個(gè)變量進(jìn)行匯總，并指定對(duì)匯總變量計(jì)對(duì)哪個(gè)變量進(jìn)行匯總，并指定對(duì)

14、匯總變量計(jì)算哪些統(tǒng)計(jì)量。算哪些統(tǒng)計(jì)量。分類匯總分類匯總基本操作分類匯總基本操作Data-Aggregate多重分類匯總多重分類匯總應(yīng)用舉例應(yīng)用舉例將將a3中年齡作為分組變量，計(jì)算語(yǔ)文、數(shù)學(xué)中年齡作為分組變量，計(jì)算語(yǔ)文、數(shù)學(xué)的均值。的均值。分類匯總練習(xí)將將a3中性別作為分組變量，計(jì)算語(yǔ)文、數(shù)學(xué)中性別作為分組變量，計(jì)算語(yǔ)文、數(shù)學(xué)的均值。的均值。6、數(shù)據(jù)分組、數(shù)據(jù)分組數(shù)據(jù)分組：數(shù)據(jù)分組：根據(jù)統(tǒng)計(jì)研究的需要，將數(shù)據(jù)按照某種標(biāo)準(zhǔn)根據(jù)統(tǒng)計(jì)研究的需要，將數(shù)據(jù)按照某種標(biāo)準(zhǔn)重新劃分為不同的組別。重新劃分為不同的組別。1）組距分組）組距分組2）分位數(shù)分組）分位數(shù)分組數(shù)據(jù)分組數(shù)據(jù)分組1）組距分組：）組距分組：Tra

15、nsform- Recorde確定分組數(shù)的經(jīng)驗(yàn)公式：確定分組數(shù)的經(jīng)驗(yàn)公式：K=1+(lgn/lg2)作為實(shí)際中的參考作為實(shí)際中的參考（1）指定分組變量）指定分組變量（2）定義分組區(qū)間：）定義分組區(qū)間：不重不漏不重不漏（3）指定存放分組結(jié)果的變量）指定存放分組結(jié)果的變量7、數(shù)據(jù)轉(zhuǎn)置、數(shù)據(jù)轉(zhuǎn)置數(shù)據(jù)轉(zhuǎn)置數(shù)據(jù)轉(zhuǎn)置Data - Transpose應(yīng)選擇一個(gè)取值唯一的變量（如職工號(hào)）作應(yīng)選擇一個(gè)取值唯一的變量（如職工號(hào)）作為標(biāo)記變量并放到為標(biāo)記變量并放到Name Variable框中。框中。例：把例：把“a3-1”文檔中的數(shù)據(jù)轉(zhuǎn)置。文檔中的數(shù)據(jù)轉(zhuǎn)置。練習(xí)將其他數(shù)據(jù)轉(zhuǎn)置。將其他數(shù)據(jù)轉(zhuǎn)置。3.7 數(shù)據(jù)加權(quán)數(shù)據(jù)加權(quán)計(jì)算某天菜市場(chǎng)蔬菜銷售的平均價(jià)格，不可計(jì)算某天菜市場(chǎng)蔬菜銷售的平均價(jià)格，不可以用各種蔬菜銷售價(jià)格的平均值，還應(yīng)該考以用各種蔬菜銷售價(jià)格的平均值，還應(yīng)該考慮每種蔬菜的銷售量。慮每種蔬菜的銷售量。加權(quán)處理：加權(quán)處理：Data-Weight Cases一旦指定加權(quán)，以后分析中加權(quán)一直有效直一旦指定加權(quán)，以后分析中加權(quán)一直有效直到取消加權(quán)為止。

人人文庫(kù)> 全部分類> 教育資料 > 課件下載

溫馨提示

1. 本站所有資源如無(wú)特殊說(shuō)明，都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
2. 本站的文檔不包含任何第三方提供的附件圖紙等，如果需要附件，請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
3. 本站RAR壓縮包中若帶圖紙，網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽，若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間，僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理，對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯，并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容，請(qǐng)與我們聯(lián)系，我們立即糾正。
7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

SPSS數(shù)據(jù)處理第二講

文檔簡(jiǎn)介

溫馨提示

最新文檔

評(píng)論

SPSS數(shù)據(jù)處理第二講

文檔簡(jiǎn)介

溫馨提示

最新文檔

評(píng)論

相關(guān)文檔