




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
第3章SPSS數(shù)據(jù)預(yù)處理1.熟練掌握數(shù)據(jù)排序、變量計(jì)算的具體操作步驟。2.熟練掌握數(shù)據(jù)去重的方法和具體操作步驟。3.熟練掌握重新編碼的具體操作步驟。4.了解各種數(shù)據(jù)分組的特點(diǎn)和適用場合,并掌握組距分組的具體操作步驟。5.熟練掌握數(shù)據(jù)選取的方法和具體操作步驟。學(xué)習(xí)目標(biāo)Part3.1SPSS數(shù)據(jù)排序SPSS數(shù)據(jù)排序數(shù)據(jù)排序概念:通常數(shù)據(jù)編輯器窗口中個(gè)案的前后次序是由數(shù)據(jù)錄入的先后順序決定的。數(shù)據(jù)預(yù)處理中,有時(shí)需要將數(shù)據(jù)按照一定的順序重新排列。例如職工可按基本工資從低到高的順序,或者按職稱從高到低的順序重新排列。數(shù)據(jù)排序作用:數(shù)據(jù)排序便于數(shù)據(jù)的瀏覽快速找到數(shù)據(jù)的最大值和最小值通過數(shù)據(jù)排序能夠快速發(fā)現(xiàn)數(shù)據(jù)中可能異常的值SPSS數(shù)據(jù)排序數(shù)據(jù)排序應(yīng)用舉例:根據(jù)大學(xué)生戀愛數(shù)據(jù),按“年級”和“每月話費(fèi)”信息對此數(shù)據(jù)集進(jìn)行升序排序。通過數(shù)據(jù)升序結(jié)果分析大學(xué)生戀愛情況。
基本操作步驟:第一步:選擇【數(shù)據(jù)(D)】→【個(gè)案排序】。第二步:指定主排序變量到【排序依據(jù)】框中,并選擇【排列順序】框中的選項(xiàng)指出該變量是按升序還是降序排列。第三步:如果是多重排序,還要依次指定第二、第三排序變量及相應(yīng)的排序規(guī)則。否則,本步可略。本例為多重排序,窗口如右圖所示。Part3.2SPSS數(shù)據(jù)去重SPSS數(shù)據(jù)去重?cái)?shù)據(jù)去重概念:通常在分析數(shù)據(jù)中不應(yīng)該出現(xiàn)關(guān)鍵變量相同的個(gè)案,對重復(fù)的個(gè)案需要剔除。導(dǎo)致出現(xiàn)重復(fù)個(gè)案的主要原因可能是由于數(shù)據(jù)錄入時(shí)的疏忽或不合理的數(shù)據(jù)編碼等造成。數(shù)據(jù)去重方法:當(dāng)數(shù)據(jù)量較大時(shí),需要自動(dòng)查找其中的重復(fù)個(gè)案。SPSS自動(dòng)查找重復(fù)個(gè)案的主要方法是排序。它首先按照用戶指定的關(guān)鍵變量對所有個(gè)案排序,關(guān)鍵變量值相同的個(gè)案將被排在一起;在相同關(guān)鍵變量值的重復(fù)個(gè)案中,正確的個(gè)案應(yīng)保留下來,還需用戶指定重復(fù)變量的排序變量,并依其進(jìn)行升序或降序的排序。同時(shí)給出有關(guān)重復(fù)個(gè)案的統(tǒng)計(jì)結(jié)果。SPSS數(shù)據(jù)去重基本操作步驟:第一步:【數(shù)據(jù)】→【標(biāo)識重復(fù)個(gè)案】;第二步:指定關(guān)鍵變量到【定義匹配個(gè)案的依據(jù)(D)】框中,這里指定ID;指定對重復(fù)個(gè)案的排序變量到【匹配組內(nèi)的排序依據(jù)(O)】框中,這里指定為學(xué)生組織個(gè)數(shù),且默認(rèn)對重復(fù)個(gè)案按升序排序;第三步:勾選【連續(xù)計(jì)算每個(gè)組合中的匹配個(gè)案】,表示默認(rèn)生成一個(gè)名為“匹配順序”的變量,變量取0表示該個(gè)案為非重復(fù)個(gè)案,取1,2,3等表示為第1,第2,第3個(gè)重復(fù)個(gè)案。SPSS實(shí)現(xiàn)標(biāo)識重復(fù)個(gè)案應(yīng)用舉例Part3.3SPSS數(shù)據(jù)變量計(jì)算SPSS數(shù)據(jù)變量計(jì)算數(shù)據(jù)變量計(jì)算概念:變量計(jì)算就是根據(jù)用戶的要求使用SPSS算術(shù)表達(dá)式及SPSS函數(shù),對所有個(gè)案或滿足SPSS條件表達(dá)式的個(gè)案,計(jì)算出新結(jié)果并存入指定變量。這個(gè)指定的變量可以是一個(gè)新變量,也可以是原有已經(jīng)存在的變量。數(shù)據(jù)變量計(jì)算目的:派生新變量變換數(shù)據(jù)的原有分布SPSS數(shù)據(jù)變量計(jì)算
SPSS算術(shù)表達(dá)式:SPSS算術(shù)表達(dá)式是由常量、變量、算術(shù)運(yùn)算符、圓括號、函數(shù)等組成的式子。字符串型常量應(yīng)當(dāng)用英文引號引起來變量是指那些存在于數(shù)據(jù)編輯器窗口中的已有變量算術(shù)運(yùn)算符主要包括+(加)、-(減)、*(乘)、/(除)、**(乘方)。SPSS條件表達(dá)式:條件表達(dá)式是對條件進(jìn)行判斷的式子。其結(jié)果有兩種取值:若判斷條件成立,則結(jié)果為真;若判斷條件不成立,則結(jié)果為假。簡單條件表達(dá)式:>(大于)、<(小于)、=(等于)、~=(不等于)、>=(大于等于)、<=(小于等于)復(fù)合條件表達(dá)式:由邏輯運(yùn)算符號、圓括號和簡單條件表達(dá)式等組成的式子。其中,邏輯運(yùn)算符號包括&或AND(并且)、|或OR(或者)、~或NOT(非)。SPSS數(shù)據(jù)變量計(jì)算
SPSS函數(shù):函數(shù)是事先編寫好并存儲在SPSS軟件中,能夠?qū)崿F(xiàn)某些特定計(jì)算任務(wù)的一段計(jì)算機(jī)程序。算術(shù)函數(shù)、統(tǒng)計(jì)函數(shù)、與分布相關(guān)的函數(shù)、查找函數(shù)、字符串函數(shù)、缺失值函數(shù)、日期函數(shù)和其他函數(shù)。SPSS數(shù)據(jù)變量計(jì)算變量計(jì)算應(yīng)用舉例:根據(jù)“學(xué)生成績數(shù)據(jù).xls”,計(jì)算各個(gè)學(xué)生的平均成績,計(jì)算規(guī)則是:所有課程成績相加除以課程門數(shù)并命名為平均分?;静僮鞑襟E(右圖是兩種方式計(jì)算學(xué)生成績平均值):第一步:選擇菜單:【轉(zhuǎn)換(T)】→【計(jì)算變量(C)】;第二步:在【數(shù)字表達(dá)式(E)】框中給出SPSS算術(shù)表達(dá)式和SPSS函數(shù),可以手工輸入,也可以使用算術(shù)表達(dá)式和函數(shù)的輸入工作;第三步:在【目標(biāo)變量(T)】框中輸入存放計(jì)算結(jié)果的變量名。Part3.4SPSS數(shù)據(jù)重新編碼SPSS數(shù)據(jù)重新編碼數(shù)據(jù)重新編碼概念:當(dāng)對數(shù)據(jù)中某些變量進(jìn)行分組處理、改變變量的值或數(shù)據(jù)類型時(shí),需要使用SPSS重新編碼功能。數(shù)據(jù)重新編碼目的:將變量的原始值重新設(shè)定;重新編碼為相同變量時(shí),變量的值改變后直接覆蓋原變量;重新編碼為不同變量時(shí),是根據(jù)原來變量某一值或某一值范圍,變成一個(gè)新的數(shù)值。SPSS數(shù)據(jù)重新編碼數(shù)據(jù)重新編碼應(yīng)用舉例:根據(jù)大學(xué)生戀愛數(shù)據(jù),對“生活費(fèi)_百元”變量進(jìn)行重新編碼?;静僮鞑襟E:第一步:點(diǎn)擊【轉(zhuǎn)換(T)】→【重新編碼為不同變量(R)】;第二步:在【輸出變量】下的【名稱(N)】框中輸入存放結(jié)果的變量名,并點(diǎn)擊【變化量(H)】按鈕確認(rèn),這里將“生活費(fèi)等級”作為新變量名。也可在【標(biāo)簽(L)】后輸入相應(yīng)的變量名標(biāo)簽;SPSS數(shù)據(jù)重新編碼基本操作步驟:第三步:點(diǎn)擊【舊值和新值(O)】按鈕,打開新舊值窗口;第四步:在【舊值】框中勾選【范圍,從最低到值(G)】并輸入“20”,再在【新值】框中,勾選【值(L)】并填入“1”,點(diǎn)擊【添加(A)】;SPSS數(shù)據(jù)重新編碼基本操作步驟:第五步:類似的操作,【舊值】框的【范圍】從“21”到“40”,【新值】的【值(L)】填“2”,單擊【添加(A)】;……【范圍,從值到最高(E)】填“81”,【新值】的【值(L)】填“5”,點(diǎn)擊【添加(A)】;第六步:點(diǎn)擊【繼續(xù)】按鈕,回到重新編碼到其他變量窗口,再點(diǎn)擊【確定】按鈕。Part3.5SPSS數(shù)據(jù)分組SPSS數(shù)據(jù)分組數(shù)據(jù)分組概念:數(shù)據(jù)分組就是根據(jù)統(tǒng)計(jì)分析的需要,將數(shù)據(jù)按照某種標(biāo)準(zhǔn)重新劃分為不同的組別。數(shù)據(jù)分組是對數(shù)值型數(shù)據(jù)進(jìn)行整理和粗略把握數(shù)據(jù)分布的重要工具,在實(shí)際數(shù)據(jù)分析中經(jīng)常使用。數(shù)據(jù)分組目的:在數(shù)據(jù)分組的基礎(chǔ)上進(jìn)行頻數(shù)分析,能概括和體現(xiàn)數(shù)據(jù)的分布特征。分組還能夠?qū)崿F(xiàn)數(shù)據(jù)的離散化處理等。SPSS數(shù)據(jù)分組
數(shù)據(jù)分組方法:組距分組組距分組是將全部變量值依次劃分為若干個(gè)區(qū)間,并將同一區(qū)間的變量值作為一組。組距分組中有兩個(gè)關(guān)鍵問題。確定分組數(shù)目:實(shí)際分組,可按照Sturges(斯特奇斯)提出的經(jīng)驗(yàn)公式來確定組數(shù)K:
上述式子中,n為數(shù)據(jù)個(gè)數(shù),對結(jié)果四舍五入取整后為理論分組數(shù)目。確定組距:組距可根據(jù)全部數(shù)據(jù)的最大值和最小值及組數(shù)來確定SPSS數(shù)據(jù)分組
數(shù)據(jù)分組應(yīng)用舉例:根據(jù)大學(xué)生戀愛數(shù)據(jù),分析大學(xué)生的戀愛情況是否會影響學(xué)習(xí)成績。要了解其情況首先進(jìn)行分組,可對“成績水平”變量進(jìn)行組距分組。先利用數(shù)據(jù)排序功能對“成績水平”進(jìn)行排序,得到最大值和最小值。根據(jù)理論應(yīng)將數(shù)據(jù)大致分為9組,但出于實(shí)際問題的研究需要,將數(shù)據(jù)分為4組。SPSS組距分組的基本操作步驟如下:第一步:【轉(zhuǎn)換(T)】→【重新編碼為不同變量(R)】第二步:選擇分組變量到【數(shù)字變量->輸出變量(V)】框中。這里選擇成績水平。第三步:在【輸出變量】框中的【名稱(N)】后輸入存放分組結(jié)果的變量名,并點(diǎn)擊【變化量(H)】按鈕確認(rèn),這里的變量名改為成績水平等級。SPSS數(shù)據(jù)分組
第四步:點(diǎn)擊【舊值和新值(O)】按鈕定義分組區(qū)間,定義好分組區(qū)間后,點(diǎn)擊【繼續(xù)(C)】;第五步:點(diǎn)擊【確定】。Part3.6SPSS數(shù)據(jù)選取SPSS數(shù)據(jù)選取數(shù)據(jù)選取概念:數(shù)據(jù)選取就是根據(jù)分析需要,從已收集到的大批量數(shù)據(jù)(總體)中按照一定的規(guī)則抽取部分?jǐn)?shù)據(jù)(樣本)參與分析。數(shù)據(jù)選取目的:數(shù)據(jù)選取在數(shù)據(jù)分析過程中很普遍,其目的也是服務(wù)于以后的數(shù)據(jù)分析。提高數(shù)據(jù)分析效率;檢驗(yàn)?zāi)P?。SPSS數(shù)據(jù)選取數(shù)據(jù)選取方法:SPSS提供了以下幾種數(shù)據(jù)選取方法。按指定條件選??;即選取符合條件的數(shù)據(jù),SPSS要求用戶以條件表達(dá)式的形式給出數(shù)據(jù)選取的條件。SPSS將自動(dòng)對數(shù)據(jù)編輯器窗口中的所有個(gè)案進(jìn)行條件判斷。對那些滿足條件的個(gè)案,即條件判斷為真的個(gè)案將被自動(dòng)選取出來,條件判斷為假的個(gè)案則不被選中。SPSS數(shù)據(jù)選取隨機(jī)選?。簩?shù)據(jù)編輯器窗口中的所有個(gè)案進(jìn)行隨機(jī)篩選,包括兩種方式:近似選取:近似選取要求用戶給出一個(gè)百分比數(shù)值。SPSS軟件將按照這個(gè)比例自動(dòng)從數(shù)據(jù)編輯器窗口中隨機(jī)抽取出相應(yīng)百分比數(shù)目的個(gè)案。由于SPSS在樣本選取方面的技術(shù)特點(diǎn),抽取出的個(gè)案總數(shù)不一定恰好精確等于用戶指定的百分比數(shù)目,會有小的偏差,因而稱為近似選取。這種樣本量的偏差通常不會對數(shù)據(jù)分析產(chǎn)生重大影響。這里的隨機(jī)是根據(jù)SPSS隨機(jī)數(shù)種子發(fā)生器設(shè)計(jì)和實(shí)現(xiàn)的。隨機(jī)數(shù)種子設(shè)置的菜單是:【轉(zhuǎn)換(T)】→【隨機(jī)數(shù)字生成器(G)】,【固定值(F)】表示隨機(jī)數(shù)種子為一個(gè)具體的正整數(shù)(該整數(shù)應(yīng)小于等于2000000),一般用于隨機(jī)化結(jié)果需要重現(xiàn)的情況;【隨機(jī)(N)】表示隨機(jī)數(shù)種子每次自動(dòng)取一個(gè)新的值,是SPSS默認(rèn)的選項(xiàng),這樣隨機(jī)化結(jié)果將不會重現(xiàn)。SPSS數(shù)據(jù)選取精確選?。壕_抽樣要求用戶給出兩個(gè)參數(shù):第一個(gè)參數(shù)是選取的個(gè)案數(shù);第二個(gè)參數(shù)是指定在前多少個(gè)案中選取。SPSS軟件會自動(dòng)在數(shù)據(jù)編輯器窗口的前若干個(gè)個(gè)案中隨機(jī)精確地抽出相應(yīng)個(gè)數(shù)的個(gè)案。SPSS數(shù)據(jù)選取
選取某一區(qū)域內(nèi)的樣本:即選取數(shù)據(jù)編輯器窗口中的樣本號范圍內(nèi)的所有個(gè)案,要求給出這個(gè)范圍的上下限個(gè)案號碼。這種選取方法通常適用于時(shí)間序列數(shù)據(jù)。SPSS數(shù)據(jù)選取通過篩選器變量選?。焊鶕?jù)篩選器變量的取值進(jìn)行選取。要求指定一個(gè)變量作為篩選器變量,變量值為非0或非系統(tǒng)缺失值的個(gè)案將被選中。這種方法通常用于排除包含系統(tǒng)缺失值的個(gè)案。SPSS數(shù)據(jù)選取數(shù)據(jù)選取應(yīng)用舉例:下面案例為某美國銀行雇員的基本信息,包括性別、年齡、教
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 五年級上冊數(shù)學(xué)教案-分?jǐn)?shù)的再認(rèn)識 北師大版
- 六年級下冊數(shù)學(xué)教案 用不同的知識解答應(yīng)用題 西師大版
- 二年級下冊數(shù)學(xué)教案-5.2 被減數(shù)中間有0的連續(xù)退位減法| 青島版(五四學(xué)制)
- 口腔門診勞動(dòng)合同(2025年版)
- 一年級下冊數(shù)學(xué)教案-動(dòng)手做(一)2 北師大版
- 六年級下冊數(shù)學(xué)教案-總復(fù)習(xí)-四則運(yùn)算的意義和法則|北師大版
- 三年級上冊數(shù)學(xué)教案-用兩步連乘解決實(shí)際問題∣蘇教版
- 2024年張緊裝置項(xiàng)目資金申請報(bào)告代可行性研究報(bào)告
- 2025年華北理工大學(xué)輕工學(xué)院單招職業(yè)傾向性測試題庫帶答案
- 數(shù)學(xué)-廣州市白云區(qū)2025年高三下學(xué)期期初綜合訓(xùn)練試題+答案
- CRF病例報(bào)告表模板
- 九上下冊物理人教版九年級物理全冊第十九章《生活用電》第3節(jié)《安全用電》課件(42張)公開課教案
- 2024年計(jì)算機(jī)二級WPS考試題庫380題(含答案)
- 2024年人教版九年級英語單詞默寫單(微調(diào)版)
- 2024至2030年中國海洋化工產(chǎn)業(yè)發(fā)展動(dòng)態(tài)及投資前景分析報(bào)告
- 22G101三維彩色立體圖集
- 【絕味鴨脖公司的存貨管理問題及完善對策8500字】
- 山東省技能大賽青島選拔賽-世賽選拔項(xiàng)目52樣題(平面設(shè)計(jì)技術(shù))
- 防排煙規(guī)范培訓(xùn)
- 2024年江蘇農(nóng)牧科技職業(yè)學(xué)院單招職業(yè)適應(yīng)性測試題庫及答案1套
- 2024年江蘇農(nóng)林職業(yè)技術(shù)學(xué)院單招職業(yè)適應(yīng)性測試題庫新版
評論
0/150
提交評論