最新spss數(shù)據(jù)文件的建立與操作_第1頁(yè)
最新spss數(shù)據(jù)文件的建立與操作_第2頁(yè)
最新spss數(shù)據(jù)文件的建立與操作_第3頁(yè)
最新spss數(shù)據(jù)文件的建立與操作_第4頁(yè)
最新spss數(shù)據(jù)文件的建立與操作_第5頁(yè)
已閱讀5頁(yè),還剩46頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、第2章 數(shù)據(jù)文件的建立與操作 u1.數(shù)據(jù)文件的建立u2.數(shù)據(jù)的編輯u3.數(shù)據(jù)文件的操作u4.變量級(jí)別的數(shù)據(jù)管理1.數(shù)據(jù)文件的建立u建立spss數(shù)據(jù)文件是利用spss進(jìn)行數(shù)據(jù)管理和統(tǒng)計(jì)分析的首要工作。用于分析的數(shù)據(jù)資料有兩種,一種是原始資料,需要將它們錄入進(jìn)spss軟件,建立數(shù)據(jù)文件;另一種是己經(jīng)被錄入為其他數(shù)據(jù)格式的資料,需要將其內(nèi)容導(dǎo)入到spss中。u1.1 數(shù)據(jù)文件的特點(diǎn)u1.2 定義變量u1.3 錄入數(shù)據(jù)u1.4 外部數(shù)據(jù)的導(dǎo)入1.1 數(shù)據(jù)文件的特點(diǎn)uspss數(shù)據(jù)文件是一種有結(jié)構(gòu)的數(shù)據(jù)文件,它由數(shù)據(jù)結(jié)構(gòu)和數(shù)據(jù)內(nèi)容兩部分組成,其中結(jié)構(gòu)部分用于定義數(shù)據(jù)類型、寬度、缺失值等,而內(nèi)容才是我們具體

2、要分析的數(shù)據(jù)。uspss數(shù)據(jù)文件的擴(kuò)展名是.sav對(duì)每個(gè)變量及相關(guān)屬性的描述就是對(duì)每個(gè)變量及相關(guān)屬性的描述就是spss 數(shù)據(jù)文件的結(jié)構(gòu)數(shù)據(jù)文件的結(jié)構(gòu)數(shù)據(jù)數(shù)據(jù)變量名變量名個(gè)案?jìng)€(gè)案case變量變量u因此spss中建立數(shù)據(jù)文件的步驟包括兩項(xiàng)工作:n定義數(shù)據(jù)文件結(jié)構(gòu)(定義變量)n錄入spss數(shù)據(jù)屬性屬性變量變量1.2 定義變量u可以使用file菜單中的new命令來(lái)建立一個(gè)數(shù)據(jù)文件,也可以在啟動(dòng)spss時(shí)選擇type in data選項(xiàng)輸入新的數(shù)據(jù)文件。u在數(shù)據(jù)編輯窗口(spss data editor)中點(diǎn)擊左下端的variable view標(biāo)簽變量窗口。u在variable view中,定義變量的屬

3、性。uspss中的變量有十個(gè)屬性:n變量名(name)變量類型(type) n變量寬度(width)小數(shù)點(diǎn)的位數(shù)(decimals)n變量名標(biāo)簽(label)變量值標(biāo)簽(values)n缺失值(missing)列的顯示寬度(columns)n對(duì)齊方式(align)測(cè)(計(jì))量尺度(measure)u要定義一個(gè)變量時(shí),至少要定義變量名和變量類型。變量名(name)u變量名是變量參與分析的唯一標(biāo)志,定義變量結(jié)構(gòu)時(shí)首先應(yīng)給出每個(gè)變量的變量名。否則,系統(tǒng)默認(rèn)為var00001、var00002、var00003等。為變量命名要遵循一定的規(guī)則。n長(zhǎng)度少于64個(gè)字符(32個(gè)漢字),可以用漢字n要唯一,不區(qū)別

4、大小寫字符,將fan與fan看作同一個(gè)變量n盡量見(jiàn)名識(shí)義n不符合規(guī)則系統(tǒng)會(huì)給出提示變量類型(type) (包括width與decimals)uspss的變量類型(type)共有3種:數(shù)值型、字符型和日期型。數(shù)值型變量按不同的要求共分為標(biāo)準(zhǔn)型、逗號(hào)型、圓點(diǎn)型、科學(xué)計(jì)數(shù)型、美元型和自定義貨幣型,系統(tǒng)默認(rèn)的為標(biāo)準(zhǔn)數(shù)值型變量(numerical)。u單擊變量視圖(variable view)中的type選項(xiàng)組,選項(xiàng)組中右側(cè)會(huì)出現(xiàn)省略號(hào)按鈕,單擊該按鈕,會(huì)彈出variable type(變量類型)對(duì)話框。 u 變量長(zhǎng)度的系統(tǒng)默認(rèn)值可以由主菜單的edit中的option中的data窗口重新設(shè)置字符數(shù)超過(guò)8

5、個(gè)字符的字符型變量稱為長(zhǎng)字符型變量,等于或少于8個(gè)字符的稱為短字符型變量。字符型變量不能參與運(yùn)算,系統(tǒng)將同一字母的大、小寫認(rèn)為是兩個(gè)不同的字符。自定義貨幣型(custom currency)spss提供5種自定義數(shù)值變量的類型。對(duì)應(yīng)的自定義類型,系統(tǒng)自動(dòng)命名為cca、ccb、ccc、ccd、cce型,系統(tǒng)默認(rèn)為逗號(hào)數(shù)值型,如123456.78顯示為123,456.78??梢杂芍鞑藛蔚膃dit中的option中的currency窗口定義常用的數(shù)值型變量。例如,要定義人民幣的輸入格式,則在prefix文本框中輸入“¥”,在suffix文本框中輸入“元”,則在數(shù)據(jù)編輯窗口定義為cca類型的數(shù)據(jù)中,輸

6、入1234,數(shù)據(jù)顯示為“¥1,234元”。 測(cè)(計(jì))量尺度(measure)u統(tǒng)計(jì)數(shù)據(jù)是對(duì)客觀現(xiàn)象計(jì)量的結(jié)果,按照對(duì)事物計(jì)量的精確程度,可將所采用的計(jì)量尺度由低級(jí)向高級(jí)分為:定類尺度、定序尺度、定距尺度、定比尺度。unorminaln 定類尺度是對(duì)事物的類別或?qū)傩缘囊环N測(cè)度,按照事物的某種屬性對(duì)其進(jìn)行分類或分組。定類變量的特點(diǎn)是其值僅代表了事物的類別和屬性,僅能測(cè)度類別差異,不能比較各類之間的大小,所以各類之間沒(méi)有順序或等級(jí)。n 在spss中,能使用定類尺度的數(shù)據(jù)可以是數(shù)值型,也可以是字符型變量。必須符合窮盡和互斥的原則。窮盡的原則就是指每個(gè)個(gè)體都必須能歸為一個(gè)類別,互斥的原則是指每個(gè)個(gè)體都只

7、能歸為一個(gè)類別。n 相應(yīng)變量為定類變量或(無(wú)序)分類變量。uordinaln定序尺度是對(duì)事物之間等級(jí)或順序差別的一種測(cè)度。n定序尺度的特點(diǎn)是可以測(cè)度類別差,還可以測(cè)度次序差,但是定序尺度無(wú)法測(cè)出數(shù)據(jù)之間的準(zhǔn)確差值,所以其計(jì)量結(jié)果只能排序,不能進(jìn)行算術(shù)四則運(yùn)算。n對(duì)定類尺度的變量只能計(jì)算頻數(shù)和頻率量。定序變量除可以計(jì)算頻率之外,還可以計(jì)算累計(jì)頻率。n相應(yīng)變量為定序變量或有序分類變量。uintervaln 定距尺度是對(duì)事物類別或次序之間間距的測(cè)度。定距變量的特點(diǎn)是其不僅能將事物區(qū)分為不同類型并進(jìn)行排序,而且可準(zhǔn)確指出類別之間的差距是多少。 n 測(cè)量結(jié)果往往表現(xiàn)為數(shù)值,所以計(jì)量結(jié)果可以進(jìn)行加減運(yùn)算。

8、uscalen 定比尺度是能夠測(cè)算兩個(gè)測(cè)度值之間比值的一種計(jì)量尺度,它的測(cè)量結(jié)果同定距變量一樣也表現(xiàn)為數(shù)值,其與定距變量的差別在于有一固定的絕對(duì)“零點(diǎn)”,而定距變量則沒(méi)有,定距變量中的“0” 并不表示“沒(méi)有”,僅僅是一個(gè)測(cè)量值,而定比變量中的“0” 就真正表示“沒(méi)有”。n 定比變量是測(cè)量尺度的最高水平,它除了具有其他三種測(cè)量尺度的全部特點(diǎn)外,還具有可計(jì)算兩個(gè)測(cè)度值之間比值的特點(diǎn),因此它可進(jìn)行加、減、乘、除運(yùn)算,而定距變量只可進(jìn)行加減運(yùn)算。u由于定距尺度與定比尺度在絕大多數(shù)統(tǒng)計(jì)分析中沒(méi)有本質(zhì)上的差別,在spss中就將其合并為一類,統(tǒng)稱為“scale”測(cè)量尺度(間隔尺度)。u相應(yīng)變量為間隔變量或連

9、續(xù)性變量。u在這4種測(cè)量尺度之間,按照信息量的高低,可將高層次測(cè)量尺度的測(cè)量結(jié)果轉(zhuǎn)換為低層測(cè)量尺度的測(cè)量結(jié)果,但這樣會(huì)損失一部分信息。不能將低層次的測(cè)量尺度轉(zhuǎn)換為高層次測(cè)量尺度的結(jié)果,這樣可能會(huì)引入錯(cuò)誤的信息。u當(dāng)輸入的是數(shù)字時(shí),系統(tǒng)默認(rèn)的是scale,當(dāng)輸入的是字符串時(shí),系統(tǒng)默認(rèn)的是nominal。變量名標(biāo)簽(label)與變量值標(biāo)簽(values)u變量名標(biāo)簽(label)n 變量名標(biāo)簽是對(duì)變量名附加的解釋說(shuō)明,增加結(jié)果數(shù)據(jù)的可讀性。由于早期版本的變量名不能超過(guò)八個(gè)字符,有時(shí)不能清楚地表達(dá)變量的含義,這時(shí)要靠變量名標(biāo)簽來(lái)對(duì)變量名加以解釋。如果變量名有標(biāo)簽,系統(tǒng)在輸出時(shí)以標(biāo)簽代替變量名輸出。

10、u變量值標(biāo)簽(value)n 是對(duì)變量的具體數(shù)值所代表的意義的標(biāo)注。n 大多數(shù)變量值都是以符號(hào)或數(shù)字來(lái)表示的。但對(duì)于定類變量和定序變量,用數(shù)字或符號(hào)不能夠很明確地表現(xiàn)出變量值的意義時(shí),可以用變量值標(biāo)簽來(lái)說(shuō)明它們所代表的實(shí)際意義。u 定義完變量值標(biāo)簽后,在spss主窗口中,在菜單欄中選擇view | value labels命令,則在spss主窗口中經(jīng)過(guò)變量值標(biāo)簽定義的數(shù)值型變量顯示為所定義的變量值。缺失值(missing)umissing項(xiàng)是一個(gè)重要而且容易被忽視的選項(xiàng),它用于定義變量缺失值。u缺失值missing,即錯(cuò)誤的數(shù)據(jù),對(duì)于沒(méi)有測(cè)量到的和測(cè)量、記錄、錄入錯(cuò)的數(shù)值,在spss中可以處理

11、成缺失值。uspss中缺失值有用戶自定義缺失值和系統(tǒng)缺失值兩大類。對(duì)于字符型變量,系統(tǒng)默認(rèn)的缺失值為空格。對(duì)數(shù)值型變量,系統(tǒng)默認(rèn)的缺失值為一個(gè)圓點(diǎn)“.”。u用戶可以自己定義缺失值。n 例如對(duì)于性別變量正常值為1和2,但在錄入時(shí),0、3等是容易被錄入的錯(cuò)誤值。將其定義為缺失值后,系統(tǒng)將認(rèn)為它們是非法值,在統(tǒng)計(jì)時(shí)會(huì)被剔除。1.3 錄入數(shù)據(jù)u定義了變量的各種屬性后,回到data view視圖中,就可以直接在表中錄入數(shù)據(jù)。在錄入數(shù)據(jù)過(guò)程中可以點(diǎn)擊save或save as作為數(shù)據(jù)文件保存。n按變量輸入數(shù)據(jù)n按觀測(cè)量輸入數(shù)據(jù)n輸入帶有變量值標(biāo)簽的數(shù)據(jù)1.4 外部數(shù)據(jù)的導(dǎo)入u為了在統(tǒng)計(jì)分析過(guò)程中能有效的利用

12、其它軟件產(chǎn)生的數(shù)據(jù),spss軟件編輯窗口除可以使用*.sav擴(kuò)展名數(shù)據(jù)文件,還可以直接打開(kāi)和保存其它類型的數(shù)據(jù)文件。u讀取excel格式的文件u讀取文本格式的文件 讀取excel格式的文件u以spss自帶的文件demo.xis為例,來(lái)看spss如何直接讀取這個(gè)文件,該文件位于spss目錄下的tutorialsample_files子目錄中。讀取文本格式的文件u以spss自帶的文件demo.txt為例,來(lái)看spss如何直接讀取這個(gè)文件,該文件位于spss目錄下的tutorialsample_files子目錄中。2.數(shù)據(jù)的編輯u查看變量信息n 可以在數(shù)據(jù)編輯器窗口中選擇variable view視

13、區(qū)瀏覽變量信息,也可以通過(guò)spss菜單欄中utilities菜單中的variables命令來(lái)查看變量信息u查看文件信息n 通過(guò)file菜單中的display data file information命令來(lái)實(shí)現(xiàn) uspss數(shù)據(jù)的定位u插入與刪除變量u插入與刪除觀測(cè)量u數(shù)據(jù)的剪切、復(fù)制和粘貼u撤銷操作3.數(shù)據(jù)文件的操作u數(shù)據(jù)文件的打開(kāi)與保存u數(shù)據(jù)排序u數(shù)據(jù)文件的分解u數(shù)據(jù)文件的合并u數(shù)據(jù)文件的轉(zhuǎn)置3.1 數(shù)據(jù)排序u使用右鍵菜單u菜單欄中選擇data | sort cases命令 3.2 數(shù)據(jù)文件的分解u拆分?jǐn)?shù)據(jù)文件的觀測(cè)量,觀測(cè)量按某種條件進(jìn)行分組;(有些統(tǒng)計(jì)命令本身具有分組的功能,有些則需要在

14、這里定義分組,再進(jìn)行某種統(tǒng)計(jì))。3.3 數(shù)據(jù)文件的合并u有時(shí)分析數(shù)據(jù)文件時(shí)會(huì)需要將幾個(gè)數(shù)據(jù)文件合并在一起分析,數(shù)據(jù)文件共有兩種合并方式:橫向合并和縱向合并。其中,橫向合并是指從外部文件中增加變量到當(dāng)前數(shù)據(jù)文件,而縱向合并是指從外部數(shù)據(jù)文件中增加觀測(cè)量到當(dāng)前數(shù)據(jù)文件中。u增加變量(橫向合并)n橫向合并是將一個(gè)spss數(shù)據(jù)文件的內(nèi)容接到數(shù)據(jù)編輯窗口中當(dāng)前數(shù)據(jù)的右邊。n橫向合并應(yīng)遵循三個(gè)條件兩個(gè)數(shù)據(jù)文件必須至少有一個(gè)變量名相同的公共變量,這個(gè)變量是兩個(gè)數(shù)據(jù)文件橫向?qū)?yīng)合并的依據(jù),稱為關(guān)鍵變量。如學(xué)號(hào)、貴賓卡號(hào)等,關(guān)鍵變量可以是多個(gè)。兩個(gè)數(shù)據(jù)文件都必須事先按關(guān)鍵變量進(jìn)行升序排列。為方便spss 數(shù)據(jù)文

15、件的合并,在不同數(shù)據(jù)文件中,數(shù)據(jù)含義不相同的列,變量名不應(yīng)取相同的名稱。u通過(guò)一個(gè)例子理解數(shù)據(jù)文件的橫向合并。n【例】將數(shù)據(jù)transform3.sav中的變量添加到transform.sav中。n在菜單欄中選擇data | merge files | add variables命令關(guān)于合并后的數(shù)據(jù)文件中的數(shù)據(jù)按哪種方式提供,spss有三個(gè)選項(xiàng)可供選擇:1.both files provide cases:是spss默認(rèn)的方式,指合并后的數(shù)據(jù)由原來(lái)的兩個(gè)數(shù)據(jù)文件共同提供,即由原來(lái)兩個(gè)數(shù)據(jù)文件中的記錄共同組成合并后的數(shù)據(jù)文件。2.external file is keyed table:指在當(dāng)前

16、己打開(kāi)數(shù)據(jù)基礎(chǔ)u增加個(gè)案(縱向合并)n縱向合并是在兩個(gè)具有相同變量的數(shù)據(jù)文件中,將其中一個(gè)數(shù)據(jù)文件的個(gè)案追加到當(dāng)前數(shù)據(jù)文件的個(gè)案中,形成新的數(shù)據(jù)文件。n縱向合并應(yīng)遵循兩個(gè)條件兩個(gè)待合并的spss數(shù)據(jù)文件,其內(nèi)容合并是有實(shí)際意義的。 為方便spss數(shù)據(jù)文件的合并,在不同數(shù)據(jù)文件中,數(shù)據(jù)含義相同的列,最好起相同的名字,變量類型和變量長(zhǎng)度也要盡量相同。u通過(guò)一個(gè)例子理解數(shù)據(jù)文件的橫向合并。n【例】將數(shù)據(jù)transform2.sav中的記錄添加到transform.sav中。n在菜單欄中選擇data | merge files | add cases命令3.4 數(shù)據(jù)文件的轉(zhuǎn)置u數(shù)據(jù)的轉(zhuǎn)置(transp

17、ose)可將數(shù)據(jù)文件行(個(gè)案)、列(變量)互換,類似于矩陣轉(zhuǎn)置。從菜單欄中選擇data | transpose(轉(zhuǎn)置)命令。4.變量級(jí)別的數(shù)據(jù)管理u4.1 計(jì)算新變量u4.2 對(duì)變量值進(jìn)行分組合并4.1 計(jì)算新變量u計(jì)算新變量的功能就是在原有spss數(shù)據(jù)文件的基礎(chǔ)之上,根據(jù)用戶的要求,使用spss算術(shù)表達(dá)式及函數(shù),對(duì)所有記錄或滿足spss條件表達(dá)式的記錄,計(jì)算出一個(gè)新結(jié)果,并將結(jié)果存入一個(gè)用戶指定的變量中。u【例】數(shù)據(jù)transform.sav是某年級(jí)學(xué)生的數(shù)學(xué)、英語(yǔ)、語(yǔ)文三門課程的成績(jī),現(xiàn)在需要統(tǒng)計(jì)英語(yǔ)成績(jī)?cè)?0分以上的學(xué)生的語(yǔ)文和數(shù)學(xué)的平均成績(jī)。u在菜單欄中選擇transform | co

18、mpute命令4.2 對(duì)變量值進(jìn)行分組合并u數(shù)據(jù)分析中,將連續(xù)變量轉(zhuǎn)換為分類變量,或者將分類變量不同的變量等級(jí)進(jìn)行合并是常見(jiàn)的工作。而recode過(guò)程可以很好地完成這一類任務(wù)。recode into same variable 是對(duì)原始變量的取值進(jìn)行修改;而recode into different variable是根據(jù)原始變量的取值生成一個(gè)新變量來(lái)表示分組情況。但為了保存原始信息的完整性,一般選后者。u對(duì)連續(xù)變量進(jìn)行分組u分類變量類別的合并對(duì)連續(xù)變量進(jìn)行分組u在spss中可以將連續(xù)變量轉(zhuǎn)換為離散(定類或定序)變量,按照某種一一對(duì)應(yīng)的關(guān)系生成新變量值,可以將新值賦給原變量,也可以生成一個(gè)新變量。recode(包括 into same

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論