版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
1、第三講第三講 數(shù)據(jù)的基本加工和處理數(shù)據(jù)的基本加工和處理SPSS數(shù)據(jù)的基本加工和處理n數(shù)據(jù)文件的整理 個(gè)案排序、個(gè)案選取、文件合并、文件轉(zhuǎn)置n數(shù)據(jù)加工 計(jì)算變量、產(chǎn)生計(jì)數(shù)變量、分類匯總、文件拆分n數(shù)據(jù)分組 手工分組、自動分組、可視化分組n數(shù)據(jù)文件的其它處理功能 指定加權(quán)變量、缺失值的替代數(shù)據(jù)文件的整理n個(gè)案排序(Sort) 將所有個(gè)案按照用戶指定的某一個(gè)或多 個(gè)變量的變量值的升序或降序重新排列 快速查找異常值和極端值 類似于Excel排序數(shù)據(jù)文件的整理n個(gè)案排序(Sort) 執(zhí)行菜單命令:Data Sort cases 指定排序關(guān)鍵字變量,用按鈕選擇到: “Sort by”中,可以是一個(gè),也可以
2、是若干個(gè)。即所謂 的第一關(guān)鍵字、第二關(guān)鍵字、第三關(guān)鍵字。 例如:按照順序選擇:語文、數(shù)學(xué)、外語。 則首先按照語文成績進(jìn)行排序,對于語文成績相同的 個(gè)案將按照數(shù)學(xué)排序,對于語文、數(shù)學(xué)成績都相同的 個(gè)案將按照外語進(jìn)行排序。 “Sort Order”將指定排序方式是用升序還是降序。 “OK” 執(zhí)行。數(shù)據(jù)文件的整理數(shù)據(jù)文件的整理數(shù)據(jù)文件的整理數(shù)據(jù)文件的整理數(shù)據(jù)文件的整理n個(gè)案選取(Select Cases) 對于全部個(gè)案按照某種方式選擇部分個(gè)案 進(jìn)行統(tǒng)計(jì)分析。選擇方式有:條件選擇、 隨機(jī)選擇、范圍選擇和運(yùn)用過濾器變量。 執(zhí)行菜單命令:Data Select cases 選擇抽樣方式:數(shù)據(jù)文件的整理n個(gè)
3、案選?。⊿elect Cases) All cases 全部個(gè)案,即不抽樣,全部個(gè)案都參與統(tǒng)計(jì)分析。 If condition is satisfied 條件選擇。即建立一定的條件表達(dá)式,對于滿足表達(dá) 式的個(gè)案將被選定。 Random sample of cases 給定一個(gè)百分比,隨機(jī)選定個(gè)案,或者從全部個(gè)案中 選擇若干個(gè)個(gè)案。數(shù)據(jù)文件的整理n個(gè)案選?。⊿elect Cases) Base on time or cases range 給定起始個(gè)案號和終止個(gè)案號。在該取值范圍內(nèi)的全部 個(gè)案將是被選定的。 Use filter Variable 如果將某變量定義為過濾器變量,則抽樣將按照該變量
4、的值進(jìn)行,這個(gè)變量值為“0”的個(gè)案將不被選定,而值不為“0”的個(gè)案將被選定。 “OK” 執(zhí)行。nTransform.sav選擇計(jì)算選擇計(jì)算nTransform.sav選擇計(jì)算選擇計(jì)算nTransform.sav選擇計(jì)算選擇計(jì)算數(shù)據(jù)文件的整理n文件合并(Merge Files) 將兩個(gè)數(shù)據(jù)文件按照文件中共同的變量名 做縱向合并,或按照某變量的取值作為索 引進(jìn)行橫向合并。 縱向合并是將外部某指定文件追加到當(dāng)前文件的后 面。參與縱向合并的兩個(gè)文件必須有共同的變量名。 橫向合并是將外部某指定文件合并到當(dāng)前文件的右 邊。參與橫向合并后的兩個(gè)文件必須有共同的索引 個(gè)案。例如:學(xué)號“ID”或姓名“Name”
5、等。數(shù)據(jù)文件的整理n文件合并(Merge Files) 縱向合并 首先需要打開一個(gè)文件作為當(dāng)前文件。執(zhí)行菜 單命令:Data Merge files Add cases回 答外部數(shù)據(jù)文件名,單擊“打開”按鈕。 在變量匹配窗口有兩個(gè)列表框。如果兩個(gè)文件 具有全部共同的變量,則合并后的新文件中將 可以具有全部共同的變量,在列表框“Variables in New Working Data File”中將顯示出來。數(shù)據(jù)文件的整理n文件合并(Merge Files) 兩個(gè)文件有不匹配的變量,在列表框“Unpaired Variables”中將顯示出不匹配變量名。 只在當(dāng)前工作文件獨(dú)有的變量,后面將有(
6、*)號。 只在外部工作文件獨(dú)有的變量,后面將有(+)號。 指定匹配。當(dāng)兩個(gè)文件中具有不同變量名,但數(shù)據(jù) 內(nèi)容是相同的時(shí),可以采取指定匹配的方式。在 Unpared Variables列表框中分別單擊選擇需配對 的兩個(gè)變量,按“Pair”按鈕,該兩個(gè)指定的變量將移 入“Variables in New Working Data file”列表框。數(shù)據(jù)文件的整理n文件合并(Merge Files) 更名匹配 可以在“Unpaired Variables”列表框中選擇變量,按 “Rename”按鈕,回答新的變量名。重命名后可以進(jìn) 行匹配操作。 強(qiáng)制移入 在“Unpared Variables”列表框
7、中選擇變量,按 按鈕強(qiáng)行移入“Variables in New Working Data file” 列表框,可以將不能匹配的變量強(qiáng)行移入。由于不 匹配,合成文件將出現(xiàn)缺失值。數(shù)據(jù)文件的整理n文件合并(Merge Files) 在合成文件中剔除某些變量 在“Variables in New Working Data file”列表框中選 擇剔除變量,按向左箭頭,將該變量將被剔除。 生成個(gè)案來源變量 選擇“Indicate case source as variable”選項(xiàng), 將生成 一個(gè)新變量: “0”表示此個(gè)案來自當(dāng)前工作文件,“1” 表示此個(gè)案來自外部文件。 應(yīng)當(dāng)強(qiáng)調(diào)的是: 相配對的兩個(gè)
8、變量必須有相同的變量 類型,寬度可以不相同,但當(dāng)前變量寬度應(yīng)大于外部 變量寬度,否則會丟失數(shù)據(jù)的位數(shù)。n數(shù)據(jù)的合并縱向縱向n數(shù)據(jù)的合并縱向縱向n數(shù)據(jù)的合并縱向縱向數(shù)據(jù)文件的整理n文件合并(Merge Files) 橫向合并 首先需要打開一個(gè)文件作為當(dāng)前文件。當(dāng)兩個(gè)數(shù)據(jù) 文件的個(gè)案數(shù)不相等或順序不一致時(shí),應(yīng)當(dāng)對兩個(gè) 文件的個(gè)案進(jìn)行相同的排序。 如果以一個(gè)或多個(gè)變量為標(biāo)準(zhǔn)對個(gè)案進(jìn)行匹配,兩 個(gè)文件需要按照這個(gè)關(guān)鍵變量的升序?qū)€(gè)案進(jìn)行排 列。數(shù)據(jù)文件的整理n文件合并(Merge Files) 執(zhí)行菜單命令: Data Merge files Add variables,回答外部數(shù)據(jù)文件名,單擊“打開
9、” 按鈕。 在橫向合并變量選擇窗口“Add Variables”中有 兩個(gè)列表框: “Exclude Variables”為不能進(jìn)入新工作文件中 的變量。 “New Working Data file”能夠進(jìn)入新工作文件 中的變量。數(shù)據(jù)文件的整理n文件合并(Merge Files) 選擇一個(gè)關(guān)鍵變量“key variables” 在兩個(gè)文件中都 有的同名變量,只有這個(gè)變量可以作為關(guān)鍵變量。 例如:學(xué)號“ID”或姓名“Name”等。 當(dāng)兩個(gè)數(shù)據(jù)文件中的個(gè)案數(shù)量不相等或順序不一致 時(shí),應(yīng)當(dāng)選擇“Match Cases on key variables in sorted file”,以確定是以哪一
10、個(gè)文件的關(guān)鍵變量為 標(biāo)準(zhǔn)對個(gè)案進(jìn)行排列。數(shù)據(jù)文件的整理n文件合并(Merge Files) 一般情況下: 如果兩個(gè)合并文件的ID不能一一對應(yīng),則將要考慮以哪一個(gè)文件的ID為準(zhǔn)了。若以當(dāng)前工作文件的關(guān)鍵變量為準(zhǔn),則外部文件不在索引范圍的個(gè)案將丟失。反之,若以外部文件的關(guān)鍵變量為準(zhǔn),則當(dāng)前工作文件不在索引范圍的個(gè)案將丟失。如果選擇兩個(gè)文件的全部個(gè)案按照關(guān)鍵變量排序,兩個(gè)文件的個(gè)案都將進(jìn)入新文件,但合并后沒有數(shù)值的相應(yīng)位置將按系統(tǒng)缺失值處理。數(shù)據(jù)文件的整理n文件合并(Merge Files) “Both files provide cases”:兩個(gè)文件的全部個(gè)案按照索引變量的關(guān)鍵字升序排列。無值處
11、按系統(tǒng)缺失值處理。 “External file is keyed table” :外部數(shù)據(jù)文件的個(gè)案按照當(dāng)前文件索引變量的關(guān)鍵字升序排列。外部文件中若無相應(yīng)值,將按系統(tǒng)缺失值處理。 “Working Data file is keyed table” :當(dāng)前工作文件的個(gè)案按照外部數(shù)據(jù)文件的索引變量的關(guān)鍵字升序排列。當(dāng)前文件中若無相應(yīng)值,將按系統(tǒng)缺失值處理。 生成標(biāo)志變量“Indicate case source as variable”。 對數(shù)據(jù)文件的整理橫向合并橫向合并,也就是變量值的合并。可以將兩個(gè)或兩個(gè)以上的,也就是變量值的合并??梢詫蓚€(gè)或兩個(gè)以上的具有相同個(gè)案的數(shù)據(jù)文件連在一起。具
12、有相同個(gè)案的數(shù)據(jù)文件連在一起。數(shù)據(jù)文件的整理n文件轉(zhuǎn)置(Transpose) 將數(shù)據(jù)文件的行列互換。執(zhí)行轉(zhuǎn)置后形成 的新數(shù)據(jù)文件中的第一列為一個(gè)新變量名 “case_lbl”,用來存放原來的變量名。 將個(gè)案轉(zhuǎn)換為變量,變量轉(zhuǎn)換為個(gè)案 如果想在新數(shù)據(jù)文件中指定新變量名,可 以先定義一個(gè)變量,其變量值在轉(zhuǎn)置后將 是新變量的名稱。數(shù)據(jù)文件的整理n文件轉(zhuǎn)置(Transpose) 執(zhí)行菜單命令:Data Transpose 在源變量列表中選擇轉(zhuǎn)置變量,用按鈕 選擇到 Variable(s)中。 在“New Variable”中可以指定某一個(gè)原來的變 量,將其值作為新變量名。 若該變量的值為沒有重復(fù)值的字
13、符串,則新變量名將取該值。 若該變量的值為有重復(fù)值的字符串,則新變量名將在重復(fù)值后添加數(shù)字序號。 若該變量的值為數(shù)值型,則新變量名將在該值前面添加字符K。同樣,在重復(fù)值后將添加序號以示區(qū)別。數(shù)據(jù)文件的整理數(shù)據(jù)文件的整理數(shù)據(jù)文件的整理數(shù)據(jù)文件的整理數(shù)據(jù)的加工n變量計(jì)算(Compute) 產(chǎn)生新變量或?qū)υ兞窟M(jìn)行必要的變換, 如城鎮(zhèn)化水平計(jì)算 SPSS算術(shù)表達(dá)式和邏輯表達(dá)式 SPSS函數(shù) 與Excel函數(shù)計(jì)算相似數(shù)據(jù)的加工n變量計(jì)算(Compute) 執(zhí)行菜單命令:Transform Compute 指定將生成的變量:“Target”,回答新變量名 建立計(jì)算表達(dá)式:“Numeric Express
14、ion”, 通過菜單所提供的計(jì)算器和變量選擇按鈕選擇變量。 如果只對部分變量值進(jìn)行指定計(jì)算,可以使用“If”按鈕輸入一個(gè)表達(dá)式,使?jié)M足表達(dá)式的變量值參與運(yùn)算,而不滿足的不進(jìn)行計(jì)算。數(shù)據(jù)的加工數(shù)據(jù)的加工數(shù)據(jù)的加工數(shù)據(jù)的加工n練習(xí)n計(jì)算課程總成績數(shù)據(jù)的加工n產(chǎn)生計(jì)數(shù)變量(Count) 對所有或部分個(gè)案,計(jì)算若干個(gè)變量中有幾個(gè)變 量的值落在指定的區(qū)域內(nèi),并將結(jié)果存入新變量 中 例如: 新的變量定義為:優(yōu)秀科目 其變量值為:語文、數(shù)學(xué)、外語等若干門成績超 過85的門數(shù)。 其中檢驗(yàn)表達(dá)式為: 語文、數(shù)學(xué)、外語的成績 85 thru Highest數(shù)據(jù)的加工n產(chǎn)生計(jì)數(shù)變量(Count) 執(zhí)行菜單命令:Tr
15、ansform Count 指定將生成的變量:“Target”,回答新變量名 指定將要計(jì)數(shù)的變量:“Numeric Expression ” 建立檢驗(yàn)表達(dá)式;“Define Value ”通過窗口提供的 計(jì)數(shù)方式框添加計(jì)數(shù)檢驗(yàn)條件。 如果只對部分變量值進(jìn)行指定計(jì)數(shù),可以使用“If” 按鈕輸入一個(gè)表達(dá)式,使?jié)M足表達(dá)式的變量值參與運(yùn) 算,而不滿足的不進(jìn)行計(jì)算。n計(jì)數(shù)變量計(jì)數(shù)變量對數(shù)據(jù)中每個(gè)學(xué)生的英語、數(shù)學(xué)和語文3門課程成績中80分以上的成績進(jìn)行計(jì)數(shù)統(tǒng)計(jì)。n計(jì)數(shù)變量計(jì)數(shù)變量數(shù)據(jù)的分組n目的:了解數(shù)據(jù)的總體分布狀況n手工分組(Recode) 將指定按照哪個(gè)變量進(jìn)行分組:即指定分 組變量 定義分組變量的
16、分組區(qū)間(不重、不漏) 指定一個(gè)存放分組結(jié)果的標(biāo)志變量 與Compute方法不同的是:Recode方法 不能進(jìn)行運(yùn)算,只能根據(jù)指定變量值作數(shù) 值轉(zhuǎn)換,且這種轉(zhuǎn)換是單一數(shù)值的轉(zhuǎn)換數(shù)據(jù)的分組n手工分組(Recode) 例如:年齡的取值是從18-60的各種取值,對于分組討論不方便,特重新定義為: Lowest thru 25 為1 26 thru 45 為2 46 thru Highest 為 3 可以使原變量的值變?yōu)椋? 2 3 三個(gè)年齡段 也可得到新變量,值為: 1 2 3 三個(gè)年齡段數(shù)據(jù)的分組n手工分組(Recode) 執(zhí)行菜單命令:Transform Recode 兩個(gè)子命令: Into s
17、ame variable Into Different Variables 分別代表在原來的變量名下更改數(shù)值或?qū)⒏臄?shù)值生成一個(gè)新變量:“Output variable”。數(shù)據(jù)的分組n手工分組(Recode) 更新原變量 執(zhí)行子命令:Into same variable 更新原變量的命令只能改變原變量的數(shù)值,不能改變其屬性。即: 數(shù)值型-數(shù)值型 字符串型-字符串型 指定要更新的變量:“Numeric ”,選擇變量建立新舊變量值的對應(yīng)關(guān)系“Old and new value” 回答:舊變量值 回答:新變量值 “Add”按鈕:加入。數(shù)據(jù)的分組n手工分組(Recode) 產(chǎn)生新變量 執(zhí)行子命令:In
18、to Different Variables 產(chǎn)生新變量的命令可以改變原變量的數(shù)值,也能改變其屬性。 數(shù)值型-數(shù)值型- 字符串型 字符串型 -字符串型- 數(shù)值型 建立新舊變量的對應(yīng)關(guān)系“Old variable new” 建立新舊變量值的對應(yīng)關(guān)系“Old and new value” 回答:舊變量值 回答:新變量值 “Add”按鈕:加入。 可以使用“If” 使?jié)M足表達(dá)式的變量值參與運(yùn)算,而不滿足的不進(jìn)行計(jì)算。數(shù)據(jù)的分組數(shù)據(jù)的分組數(shù)據(jù)的分組數(shù)據(jù)的分組數(shù)據(jù)的分組數(shù)據(jù)的分組數(shù)據(jù)的分組數(shù)據(jù)的分組數(shù)據(jù)的分組數(shù)據(jù)的分組數(shù)據(jù)的分組數(shù)據(jù)的分組數(shù)據(jù)的分組數(shù)據(jù)的分組n變量賦值p45n變量賦值n變量賦值p45數(shù)據(jù)的
19、分組n自動分組(Automatic Recode) 相當(dāng)于按照結(jié)點(diǎn)處取最小值的連續(xù)賦值產(chǎn) 生一個(gè)重編碼變量。 與求秩分變量唯一不同的是在輸出窗口處 將產(chǎn)生一個(gè)新舊對照的變量值列表。數(shù)據(jù)的分組n自動分組(Automatic Recode) 執(zhí)行菜單命令:Transform Automatic recode 指定求秩分的變量,用按鈕選擇到: “Variable New Name”, “New Name”,回答新變量名, “Recode starting value” 回答起始值, “Lowest value”,表示將變量的最小值定為1(順序) “Highest value”,表示將變量的最大值定為
20、1(倒序)數(shù)據(jù)的分組數(shù)據(jù)的分組數(shù)據(jù)的分組數(shù)據(jù)的分組數(shù)據(jù)的分組n字符變量轉(zhuǎn)換為數(shù)字變量n字符變量轉(zhuǎn)換為數(shù)字變量數(shù)據(jù)文件的其它處理功能n加權(quán)(Weight Cases) 在進(jìn)行個(gè)案之間的數(shù)值比較時(shí),通常為了提高其合理性,可以對不同個(gè)案的取值添加一個(gè)系數(shù)。 個(gè)案數(shù)值為零、負(fù)數(shù)和缺失值的時(shí)候,權(quán)重的取值為零。 在Chi-Squre檢驗(yàn)中必不可少。 權(quán)重一旦確定將一直有效,除非將其取消或者定義其他變量為權(quán)重。數(shù)據(jù)文件的其它處理功能n加權(quán)(Weight Cases) 建立一個(gè)權(quán)重變量??梢允止ぽ斎耄部?以用Compute或者用 Recode建立。 執(zhí)行菜單命令:Data Weight cases 選擇權(quán)重變量: 選擇“Weight cases by”在 “Frequency”中 指定權(quán)重變量。 選擇“Do not weight cases”將取消加 權(quán)。數(shù)據(jù)文件的其它處理功能數(shù)據(jù)文件的其它處理功能數(shù)據(jù)文件的其它處理功能數(shù)據(jù)文件的其它處理功能n缺失值的替代(Replace Missing Values) 對于缺失值可采取多種科學(xué)方法進(jìn)行替代 用該變量的所有非缺失值的均數(shù)做替代 用缺失值相鄰點(diǎn)的非缺失值的均數(shù)做替 代,
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 今冬明春安全生產(chǎn)
- 醫(yī)療器械公司屋頂搭建施工合同
- 礦泉水廠施工合同文本
- 電商客服人員聘用合同書
- 物流行業(yè)稅務(wù)籌劃
- 健身教練操作工招聘協(xié)議
- 橋梁擴(kuò)建電纜頂管施工合同
- 學(xué)校體育館鋼結(jié)構(gòu)樓梯施工合同
- 保齡球器材租賃合同模板
- 水上婚禮婚禮樂隊(duì)游艇租賃合同
- 2024年6月2日《證券投資顧問》真題卷(79題)
- 招投標(biāo)咨詢合同文本
- 2025年中考語文復(fù)習(xí)之文言文閱讀
- 2024統(tǒng)編版(2024)道德與法治小學(xué)一年級上冊教學(xué)設(shè)計(jì)(附目錄)
- 2.2 直線的方程(分層練習(xí))(解析版)
- 《保密法》培訓(xùn)課件
- 北京市2024-2025學(xué)年高三上學(xué)期第二次普通高中學(xué)業(yè)水平合格性考試英語試卷 含解析
- 2024版《中醫(yī)基礎(chǔ)理論經(jīng)絡(luò)》課件完整版
- 2024年全球 二次元移動游戲市場研究報(bào)告-點(diǎn)點(diǎn)數(shù)據(jù)
- 第6課《我們神圣的國土》第1課時(shí)(教學(xué)設(shè)計(jì))-部編版道德與法治五年級上冊
- 綿陽市高中2022級(2025屆)高三第一次診斷性考試(一診)物理試卷(含標(biāo)準(zhǔn)答案)
評論
0/150
提交評論