spss數(shù)據(jù)的錄入與管理(課堂PPT)_第1頁
spss數(shù)據(jù)的錄入與管理(課堂PPT)_第2頁
spss數(shù)據(jù)的錄入與管理(課堂PPT)_第3頁
spss數(shù)據(jù)的錄入與管理(課堂PPT)_第4頁
spss數(shù)據(jù)的錄入與管理(課堂PPT)_第5頁
已閱讀5頁,還剩34頁未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

1、.1數(shù)據(jù)的錄入與管理數(shù)據(jù)的錄入與管理報(bào)告人:.2第二章 數(shù)據(jù)錄入與數(shù)據(jù)獲取 第三章 變量級別的數(shù)據(jù)管理第四章 文件級別的數(shù)據(jù)管理.3第二章 數(shù)據(jù)錄入與數(shù)據(jù)獲取數(shù)據(jù)的直接錄入非電子化的原始數(shù)據(jù)資料,需要直接將調(diào)查問卷中的數(shù)據(jù)錄入進(jìn)SPSS軟件中,建立數(shù)據(jù)文件。外部數(shù)據(jù)的獲取已經(jīng)被錄入為其他數(shù)據(jù)格式的資料,需要將其內(nèi)容直接讀入SPSS中。.42.2 數(shù)據(jù)格式原則:(1)不同個(gè)案的數(shù)據(jù)不能再同一條記錄中出現(xiàn),即同一個(gè)案的數(shù)據(jù)應(yīng)當(dāng)獨(dú)占一行。(2)每一個(gè)測量指標(biāo)/影響因素只能占據(jù)一列的位置,即同一指標(biāo)的測量數(shù)值都應(yīng)當(dāng)錄入到同一個(gè)變量中去。.5“數(shù)據(jù)錄入三部曲”(1)定義各變量名,即給每個(gè)指標(biāo)起個(gè)名字;(

2、2)指定每個(gè)變量的各種屬性,即對每個(gè)指標(biāo)的一些統(tǒng)計(jì)特性做出指定;(3)錄入數(shù)據(jù),即把每個(gè)被訪者各指標(biāo)取值錄入為電子格式。.6變量屬性1、變量的存儲(chǔ)類型數(shù)值型 字符串 日期型(1)數(shù)值型(Numeric)最常用 是由09的阿拉伯?dāng)?shù)字和其他特殊符號,如美元符號、逗號或圓點(diǎn)組成的。(工資、年齡、成績等)標(biāo)準(zhǔn)數(shù)值型逗號數(shù)值型:每3位用逗號分隔圓點(diǎn)數(shù)值型:每3位用圓點(diǎn)分隔科學(xué)計(jì)數(shù)型美元數(shù)值型:顯示時(shí)帶美元符號用戶自定義型.7(2)字符型(String)較常用 默認(rèn)顯示寬度為8個(gè)字符位,區(qū)分大小寫字母,并且不能進(jìn)行數(shù)學(xué)運(yùn)算。用一對引號引起來(3)日期型(Date)表示日期或時(shí)間mm/dd/yy或類似的兩位

3、數(shù)年份記錄方式.82、變量的測量尺度定類尺度 定序尺度 定距尺度 定比尺度(1)定類尺度是對事物的類別或?qū)傩缘囊环N測量,按照事物的某種屬性對其進(jìn)行分類或分組。其值僅代表了事物的類別和屬性,僅能測定類別差,不能比較各類之間的大小,所以各類之間沒有順序或等級。只能計(jì)算頻數(shù)和頻率 “S0城市”.9(2)定序尺度對事物之間等級或順序差類別的一種測度,可以比較優(yōu)劣或排序,但無法測出類別之間的準(zhǔn)確差值??梢杂?jì)算頻率、累計(jì)頻率 “S4學(xué)歷”(3)定距尺度對事物類別或次序之間間距的測度。不僅能將事物區(qū)分為不同類型并進(jìn)行排序,而且可以準(zhǔn)確指出類別之間差距是多少。 “溫度”(4)定比尺度能夠測量兩個(gè)測量值之間的比

4、值“零點(diǎn)” 溫度與重量.103、變量名與變量值標(biāo)簽變量值標(biāo)簽是對變量取值含義的解釋說明信息。4、缺失值系統(tǒng)缺失值:“.”/空字符串自定義缺失值:“缺失值屬性對話框”5、角色(1)輸入 (2)目標(biāo) (3)兩者(4)無 (5)分區(qū) (6)拆分.112.3 數(shù)據(jù)的直接錄入1、開放題的錄入“ID”數(shù)值型開放題“姓名”字符型開放題2、單選題的錄入“性別”字符直接錄入 字符代碼+值標(biāo)簽 數(shù)值代碼+值標(biāo)簽3、半開放題的錄入“其他,請指出”選項(xiàng)兩個(gè)變量:(1)選項(xiàng) (2)獨(dú)立的開放題:第一個(gè)變量名直接加 “a”.125、多選題的錄入稱為“多重響應(yīng)” 數(shù)據(jù)錄入后需定義多選題集“多重二分法”“多重分類法”(1)多

5、重二分法指在編碼時(shí),對應(yīng)每一個(gè)選項(xiàng)都要定義一個(gè)變量,有幾個(gè)選項(xiàng)就有幾個(gè)變量,這些變量分別代表對其中一個(gè)選項(xiàng)的選擇結(jié)果,一般均為二分類,而其中必然有一個(gè)類別代表選中了這一選項(xiàng)。.13(2)多重分類法利用多個(gè)變量來對一個(gè)多選題的答案進(jìn)行定義,應(yīng)該用多少個(gè)變量由被訪者實(shí)際可能給出的最多答案數(shù)而定。而且,這些變量必須為數(shù)值型變量,利用值標(biāo)簽將答案標(biāo)出,所有變量采用一套值標(biāo)簽。之所以稱為多重分類法,是因?yàn)槊總€(gè)變量都是多分類的,每個(gè)變量代表被訪者的一次選擇。設(shè)定多選題變量集Tables模塊和多重響應(yīng)菜單(分析 多重響應(yīng) 定義變量集).146、半開放多選題與半開放單選題非常相似.152.4 外部數(shù)據(jù)的獲取

6、SPSS格式:“文件” “打開” “數(shù)據(jù)”非SPSS格式:直接打開(Excel格式) 利用文本向?qū)ёx入文本數(shù)據(jù)(文本數(shù)據(jù)) 利用數(shù)據(jù)庫ODBC接口讀?。ˋccess數(shù)據(jù)).161、讀取電子表格數(shù)據(jù)文件“文件” “打開” “數(shù)據(jù)”或Demo.xls事先打開了解文件結(jié)構(gòu):(1)包含幾個(gè)數(shù)據(jù)表(2)若只需讀入部分,了解精確位置(3)第1行是否為變量名.172、讀取文本數(shù)據(jù)文件“文件” “打開文本數(shù)據(jù)” “文件” “打開” “數(shù)據(jù)”demo.txt.183、用ODBC接口讀取各種數(shù)據(jù)庫文件demo.mdb“文件” “打開數(shù)據(jù)庫” “新建查詢”.192.5 數(shù)據(jù)的保存1、保存為SAV格式2、保存為其他數(shù)

7、據(jù)格式.20第三章 變量級別的數(shù)據(jù)管理變量級別的數(shù)據(jù)管理:“轉(zhuǎn)換”文件級別的數(shù)據(jù)管理:“數(shù)據(jù)”.21“轉(zhuǎn)換”1、計(jì)算新變量:最為常用和重要的過程2、變量轉(zhuǎn)換:從菜單第2項(xiàng)開始的多個(gè)計(jì)數(shù)過程、重編碼過程和離散化過程。實(shí)際上可以看成是“計(jì)算變量”過程某一方面的強(qiáng)化和打包。3、時(shí)間序列模型專用過程:“時(shí)間和日期向?qū)А薄ⅰ皠?chuàng)建時(shí)間序列”、“替換缺失值”4、自動(dòng)數(shù)據(jù)準(zhǔn)備5、其他:“隨機(jī)數(shù)字生成器”(第5章)、“運(yùn)行掛起的轉(zhuǎn)換”.223.1 變量賦值變量賦值就是指在原有數(shù)據(jù)的基礎(chǔ)上,根據(jù)用戶的要求,使用SPSS算術(shù)表達(dá)式及函數(shù),對所有記錄或滿足SPSS條件表達(dá)式的某些記錄進(jìn)行四則運(yùn)算,并將結(jié)果存入一個(gè)用戶

8、指定的變量中,該指定變量可以是一個(gè)新變量,也可以是一個(gè)已經(jīng)存在的變量。1、算術(shù)表達(dá)式:由常量、SPSS變量名、SPSS算術(shù)運(yùn)算符(+、-、*、/、*)圓括號等組成的式子。數(shù)據(jù)類型和結(jié)果均為數(shù)值型。2、函數(shù):函數(shù)名(參數(shù));8類函數(shù)3、條件表達(dá)式與邏輯表達(dá)式:用來指定對哪些記錄進(jìn)行計(jì)算.23計(jì)算變量“轉(zhuǎn)換” “計(jì)算變量”“目標(biāo)變量”文本框:用于輸入需要賦值的變量名候選變量列表“數(shù)字表達(dá)式”文本框:用于給目標(biāo)變量賦值“函數(shù)組”列表框“函數(shù)和特殊變量”列表框函數(shù)解釋文字文本框.24.253.2 已有變量值的分組合并將連續(xù)變量轉(zhuǎn)換為等級變量或?qū)⒎诸愖兞坎煌淖兞康燃夁M(jìn)行合并?!爸匦戮幋a為相同變量”:對

9、原始變量的取值直接進(jìn)行重編碼“重新編碼為不同變量”:根據(jù)原始變量的取值生成一個(gè)新變量來記錄重編碼的結(jié)果。.26對連續(xù)性變量進(jìn)行分組合并兩種方法:重編碼 可視化分段過程重編碼:“轉(zhuǎn)換” “重新編碼為不同變量”分類變量類別的合并.27連續(xù)性變量的離散化可視化離散化過程:用于在可視界面下將連續(xù)變量進(jìn)行分段,該過程可以使用百分位數(shù)、標(biāo)準(zhǔn)差范圍或者等間距方式將連續(xù)變量劃分為若干組段,并采用圖形化操作的方式,非常直觀好用。最優(yōu)離散化過程:是對前述可視化離散過程的進(jìn)一步自動(dòng)化,根據(jù)某些作為“關(guān)鍵指示變量”的分類變量,將原有的一個(gè)或多個(gè)連續(xù)性變量按照該分類變量類間差異最大化的優(yōu)化原則離散化為分類變量,然后就可

10、以使用離散后變量而非原始數(shù)據(jù)值進(jìn)行后續(xù)的分析了。.283.4 轉(zhuǎn)換菜單的其他功能變量的自動(dòng)重編碼用于將字符變量轉(zhuǎn)換為數(shù)值變量變量值的移動(dòng)某變量值的前移或后移指定數(shù)值的查找和計(jì)數(shù)對某個(gè)個(gè)案進(jìn)行計(jì)數(shù)變量的編秩根據(jù)某變量的數(shù)值大小來排出次序,然后將次序結(jié)果存儲(chǔ)到一個(gè)新變量中去自動(dòng)準(zhǔn)備建模數(shù)據(jù)隨機(jī)數(shù)字生成器.29第四章 文件級別的數(shù)據(jù)管理(1)簡單命令:插入變量、插入個(gè)案、到達(dá)某條個(gè)案、復(fù)制數(shù)據(jù)集等(2)常用簡單過程:排序、拆分文件、個(gè)案篩選和個(gè)案加權(quán),必須掌握。(3)數(shù)據(jù)重組向?qū)В河糜谶M(jìn)行數(shù)據(jù)轉(zhuǎn)置,或者對重復(fù)測量數(shù)據(jù)進(jìn)行長型、寬型記錄格式間的轉(zhuǎn)換。(4)文件合并向?qū)В簩讉€(gè)數(shù)據(jù)文件合并為一個(gè)大的SP

11、SS數(shù)據(jù)文件,含橫向合并和縱向合并兩種情況。(5)數(shù)據(jù)字典相關(guān)向?qū)В喊ǘx變量屬性,復(fù)制變量屬性,以及新建設(shè)定屬性三個(gè)向?qū)Ы缑妗#?)與數(shù)據(jù)準(zhǔn)備有關(guān)的功能:用于復(fù)雜數(shù)據(jù)項(xiàng)目,用于簡化數(shù)據(jù)管理工作。(7)與統(tǒng)計(jì)模型密切相關(guān)過程:正交設(shè)計(jì)過程(8)其他過程:定義多重響應(yīng)集、數(shù)據(jù)匯總過程等。.304.1 幾個(gè)常用的過程1、排序個(gè)案數(shù)據(jù)編輯窗口中的記錄的前后次序在默認(rèn)情況下由錄入時(shí)的先后順序決定。(1)單變量排序:變量名處右擊,“升序排列”“降序排列”(2)多變量排序:使用“排序個(gè)案”對話框2、分割文件(Split File)3、選擇個(gè)案:用于只分析部分?jǐn)?shù)據(jù)4、加權(quán)個(gè)案:(1)以頻數(shù)格式錄入的數(shù)據(jù)

12、(2)案例數(shù)據(jù)抽樣權(quán)重的調(diào)整5、分類匯總:按指定的分類變量對個(gè)案進(jìn)行分組,并按分組對變量求指定的描述統(tǒng)計(jì)量。.314.3 數(shù)據(jù)文件的重組與轉(zhuǎn)置1、數(shù)據(jù)的長型與寬型格式指的是重復(fù)測量數(shù)據(jù)的兩種不同的排列方式。長型格式:在重復(fù)測量數(shù)據(jù)中,每一次測量被單獨(dú)記錄為一個(gè)個(gè)案( anxiety.sav )寬型格式:在重復(fù)測量數(shù)據(jù)中,每一個(gè)個(gè)體被記錄為一個(gè)個(gè)案,他的所有測量被記錄在不同的變量中(anxiety2.sav).322、長型格式轉(zhuǎn)換為寬型格式3、寬型格式轉(zhuǎn)換為長型格式4、數(shù)據(jù)轉(zhuǎn)置.334.3 多個(gè)數(shù)據(jù)文件的合并1、縱向拼接指的是幾個(gè)數(shù)據(jù)集中的數(shù)據(jù)縱向相連,組成一個(gè)新的數(shù)據(jù)集,新數(shù)據(jù)集中的記錄數(shù)是原

13、來幾個(gè)數(shù)據(jù)集中記錄數(shù)的總和。其實(shí)質(zhì)就是將兩個(gè)數(shù)據(jù)文件的變量按照各個(gè)變量名的含義一一對應(yīng)進(jìn)行首尾相接。(a和b)2、橫向合并指的是按照記錄的次序,或者某個(gè)關(guān)鍵變量的數(shù)值,將不同數(shù)據(jù)集中的不同變量拼接為一個(gè)數(shù)據(jù)集,新數(shù)據(jù)集中的變量數(shù)是所有原數(shù)據(jù)集中不重名變量的總和。實(shí)質(zhì)就是將兩個(gè)數(shù)據(jù)文件的記錄按照某種對應(yīng)關(guān)系一一進(jìn)行左右對接。(a和c).344.4 與數(shù)據(jù)字典有關(guān)的功能如果有事先定義的數(shù)據(jù)字典格式,則可以先生成一個(gè)沒有記錄的空數(shù)據(jù)文件,將全部的數(shù)據(jù)字典設(shè)定好,將來在數(shù)據(jù)錄入完畢后使用復(fù)制文件屬性向?qū)子靡幌伦值浼纯?;如果沒有事先定義的數(shù)據(jù)字典格式,則可以在錄入工作進(jìn)行了一段時(shí)間以后先使用變量屬性定

14、義向?qū)瓿蓴?shù)據(jù)字典的設(shè)定工作,然后隨著錄入工作的進(jìn)行經(jīng)常掃描數(shù)據(jù)的情況,以及時(shí)更新字典,最后在錄入工作完畢后使用復(fù)制文件屬性向?qū)?yīng)用字典的最終版本。如果數(shù)據(jù)管理任務(wù)不太復(fù)雜,也可以直接在數(shù)據(jù)字典中錄入數(shù)據(jù),或者直接在變量視圖中修改屬性,或者直接在SPSS中錄入/導(dǎo)入數(shù)據(jù),然后利用設(shè)置未知測量級別向?qū)砜焖僭O(shè)定數(shù)據(jù)字典。.351、定義變量屬性2、復(fù)制變量屬性3、新建自定義屬性4、設(shè)置未知測量屬性.364.5 與數(shù)據(jù)準(zhǔn)備有關(guān)的功能1、數(shù)據(jù)驗(yàn)證模塊2、自動(dòng)數(shù)據(jù)準(zhǔn)備過程3、標(biāo)識(shí)重復(fù)個(gè)案過程4、標(biāo)識(shí)異常個(gè)案過程5、最優(yōu)離散化過程6、缺失值分析.37數(shù)據(jù)驗(yàn)證模塊數(shù)據(jù)驗(yàn)證模塊用于實(shí)現(xiàn)數(shù)據(jù)核查功能,用戶通過自行定義數(shù)據(jù)驗(yàn)證規(guī)則,以確定個(gè)案取值是否有效。A 單變量規(guī)則:單變量規(guī)則包含一組應(yīng)用于單個(gè)變量的數(shù)值檢查規(guī)則,例如,范圍外值的檢查。對于單變量規(guī)

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論