實(shí)驗(yàn)1 數(shù)據(jù)挖掘工具的使用_第1頁
實(shí)驗(yàn)1 數(shù)據(jù)挖掘工具的使用_第2頁
實(shí)驗(yàn)1 數(shù)據(jù)挖掘工具的使用_第3頁
實(shí)驗(yàn)1 數(shù)據(jù)挖掘工具的使用_第4頁
實(shí)驗(yàn)1 數(shù)據(jù)挖掘工具的使用_第5頁
已閱讀5頁,還剩4頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、實(shí)驗(yàn)1 數(shù)據(jù)挖掘工具SPSS的使用實(shí)驗(yàn)?zāi)康牧私饨y(tǒng)計(jì)與數(shù)據(jù)挖掘工具SPSS的運(yùn)行環(huán)境、窗體結(jié)構(gòu)等,掌握SPSS的安裝與運(yùn)行、數(shù)據(jù)的輸入與保存、數(shù)據(jù)表的編輯與修改。實(shí)驗(yàn)內(nèi)容1、SPSS的安裝與運(yùn)行2、查看SPSS窗體的主菜單有哪些主要功能3、數(shù)據(jù)的輸入與保存4、數(shù)據(jù)表的編輯與修改實(shí)驗(yàn)條件1.操作系統(tǒng):Windows XP SP22.SPSS13。1實(shí)驗(yàn)要求1、 練習(xí)實(shí)驗(yàn)內(nèi)容1。2、 練習(xí)實(shí)驗(yàn)內(nèi)容2。3、 試錄入以下數(shù)據(jù)文件,并按要求進(jìn)行變量定義。學(xué)號(hào)姓名性別生日身高(cm)體重(kg)英語(總分100分)數(shù)學(xué)(總分100分)生活費(fèi)($代表人民幣)200201劉一迪男1982.01.12156.42

2、47.547579345.00200202許兆輝男1982.06.05155.7337.837876435.00200203王鴻嶼男1982.05.17144.638.666588643.50200204江飛男1982.08.31161.541.687982235.50200205袁翼鵬男1982.09.17161.343.368277867.00200206段燕女1982.12.2115847.358174200207安劍萍女1982.10.18161.547.4477691233.00200208趙冬莉女1982.07.06162.7647.876773767.80200209葉敏女198

3、2.06.01164.333.856477553.90200210毛云華女1982.09.1214433.847080343.00200211孫世偉男1981.10.13157.949.238485453.80200212楊維清男1981.12.6176.154.548580843.00200213歐陽已祥男1981.11.21168.5550.677979657.40200214賀以禮男1981.09.28164.544.5675801863.90200215張放男1981.12.0815358.877669462.20200216陸曉藍(lán)女1981.10.07164.744.14808347

4、6.80200217吳挽君女1981.09.09160.553.347982200218李利女1981.09.1414736.467597452.80200219韓琴女1981.10.15153.230.179075244.70200220黃捷蕾女1981.12.02157.940.457180253.001)變量名同表格名,以“()”內(nèi)的內(nèi)容作為變量標(biāo)簽。對(duì)性別(Sex)設(shè)值標(biāo)簽“男=0;女=1”。2)正確設(shè)定變量類型。其中學(xué)號(hào)設(shè)為數(shù)值型;日期型統(tǒng)一用“mm/dd/yyyy“型號(hào);生活費(fèi)用貨幣型。3)變量值寬統(tǒng)一為10,身高與體重、生活費(fèi)的小數(shù)位2,其余為0。4)在實(shí)驗(yàn)報(bào)告單上記錄數(shù)據(jù)庫中各

5、個(gè)變量的屬性,即將variable view下的表格內(nèi)容記錄到實(shí)驗(yàn)報(bào)告單上。5)將數(shù)據(jù)保存為student.sav的數(shù)據(jù)表文件,以備在后續(xù)的實(shí)驗(yàn)中使用。4、搜集數(shù)據(jù),建立一個(gè)數(shù)據(jù)文件記錄你所在宿舍學(xué)生下列情況,學(xué)號(hào)、姓名、姓別、年齡、籍貫、民族、家庭電話號(hào)碼、出生年月、學(xué)期平均成績(jī)、評(píng)定成績(jī)等級(jí)(優(yōu)、良、中、差)、興趣愛好等,給出合理的變量名、變量類型、標(biāo)簽及值標(biāo)簽、測(cè)度水平,并在SPSS中設(shè)置變量類型和錄入數(shù)據(jù),將文件保存為roommember.sav,以備在后續(xù)的實(shí)驗(yàn)中使用。將操作步驟、變量視圖下的變量設(shè)置情況、數(shù)據(jù)視圖下的數(shù)據(jù)記錄到實(shí)驗(yàn)報(bào)告中。實(shí)驗(yàn)思考與練習(xí)1、 如何把外部的數(shù)據(jù)文件(如

6、EXCEL,SQL SERVER數(shù)據(jù)庫表等)導(dǎo)入SPSS中。2、 在定義變量時(shí),數(shù)值Value變量值標(biāo)簽如何使用,試舉例說明。3、 在定義變量時(shí),標(biāo)簽Label變量標(biāo)簽有什么作用?4、 數(shù)據(jù)和轉(zhuǎn)換菜單中各子菜單有怎樣的功能,試通過練習(xí)自行總結(jié)。實(shí)驗(yàn)步驟及指導(dǎo)1、 SPSS的運(yùn)行1)單擊Windows 的開始按鈕(如圖1-1所示),在程序菜單項(xiàng)SPSS for Windows中找到SPSS 13.0 for Windows并單擊。圖1-1 SPSS啟動(dòng)2)在彈出窗口中選擇所需下一步完成功能對(duì)應(yīng)的單選按鈕(如圖1-2所示),然后點(diǎn)擊確定按鈕進(jìn)行相應(yīng)的界面,或者單擊關(guān)閉按鈕或標(biāo)題欄上的關(guān)閉按鈕直接進(jìn)

7、行SPSS系統(tǒng)主窗口。3)在彈出窗口中選擇“輸入數(shù)據(jù)”,然后點(diǎn)擊“確定”按鈕,進(jìn)入系統(tǒng)數(shù)據(jù)輸入窗口(系統(tǒng)主窗口)4)退出SPSS選擇主窗口文件(File)菜單中的退出(Exit)或單擊標(biāo)題欄上的關(guān)閉按鈕退出SPSS。2、SPSS的主窗口SPSS13.0主菜單包括十個(gè)菜單(如圖1-3所示):1)文件(File):用于新建SPSS 各種類型文件,打開一個(gè)已存在的文件,從文本文件或其它數(shù)據(jù)源讀入數(shù)據(jù)。2)編輯(Edit):用于撤消操作、剪切、復(fù)制、粘貼、查找、改變SPSS 默認(rèn)設(shè)置等。3)視圖(View):運(yùn)用“視圖”菜單顯示或隱藏狀態(tài)行、工具欄、網(wǎng)絡(luò)線、值標(biāo)簽和改變字體。4)數(shù)據(jù)(Data):運(yùn)用

8、“”菜單對(duì)SPSS 數(shù)據(jù)文件進(jìn)行全局變化,例如定義變量,合并文件,轉(zhuǎn)置變量和記錄,或產(chǎn)生分析的觀測(cè)值子集等。5)轉(zhuǎn)換(Transform):“轉(zhuǎn)換”菜單在數(shù)據(jù)文件中對(duì)所選擇的變量進(jìn)行變換,并在已有變量值的基礎(chǔ)上計(jì)算新的變量。6)分析(Analyze):“分析”菜單在以前版本中為“統(tǒng)計(jì)(Statistics)”,可進(jìn)行各種統(tǒng)計(jì)分析,包括各種統(tǒng)計(jì)過程(Procedure),如回歸分析、相關(guān)分析、因子分析等等。7)圖表(Graphs):“圖表”菜單產(chǎn)生條形圖、餅圖、直方圖、散點(diǎn)圖和其它全顏色、高分辨率的圖形,以及動(dòng)態(tài)的交互式圖形。有些統(tǒng)計(jì)過程也產(chǎn)生圖形,所有的圖形都可以編輯。8)工具(Utiliti

9、es):“工具”菜單可以顯示數(shù)據(jù)文件和變量的信息,定義子集,運(yùn)行腳本程序,自定義SPSS 菜單等。9)窗口(Window):“窗口”菜單用于選擇不同窗口和最小化所有窗口。10)幫助(Help):“幫助”菜單包含SPSS 幫助主題、SPSS 教程、SPSS 公司主頁、統(tǒng)計(jì)教練等菜單項(xiàng)。打開系統(tǒng)教程打開數(shù)據(jù)輸入窗口打開查詢文件(*.spq)打開數(shù)據(jù)庫向?qū)?,從其它外部?shù)據(jù)庫(如excel, sql server, fox pro等)中導(dǎo)入數(shù)據(jù)入數(shù)據(jù),打開SPSS數(shù)據(jù)文件(*.sav)打開其它類型的文件,如(*.sps, *.spo, *.sps,*.rbf, *.sts)雙擊直接打開系統(tǒng)(*.sav

10、)類型文件打開窗口雙擊直接打開系統(tǒng)(*.sps, *.spo, *.sps,*.rbf, *.sts)類型文件窗口打開系統(tǒng)教程打開數(shù)據(jù)輸入窗口打開查詢文件(*.spq)打開數(shù)據(jù)庫向?qū)?,從其它外部?shù)據(jù)庫(如excel, sql server, fox pro等)中導(dǎo)入數(shù)據(jù)入數(shù)據(jù),打開SPSS數(shù)據(jù)文件(*.sav)打開其它類型的文件,如(*.sps, *.spo, *.sps,*.rbf, *.sts)雙擊直接打開系統(tǒng)(*.sav)類型文件打開窗口雙擊直接打開系統(tǒng)(*.sps, *.spo, *.sps,*.rbf, *.sts)類型文件窗口打開系統(tǒng)教程打開數(shù)據(jù)輸入窗口打開查詢文件(*.spq)打

11、開數(shù)據(jù)庫向?qū)?,從其它外部?shù)據(jù)庫(如excel, sql server, fox pro等)中導(dǎo)入數(shù)據(jù)入數(shù)據(jù),打開SPSS數(shù)據(jù)文件(*.sav)打開其它類型的文件,如(*.sps, *.spo, *.sps,*.rbf, *.sts)雙擊直接打開系統(tǒng)(*.sav)類型文件打開窗口雙擊直接打開系統(tǒng)(*.sps, *.spo, *.sps,*.rbf, *.sts)類型文件窗口圖1-2 SPSS啟動(dòng)彈出窗口圖1-3 SPSS主窗口3、SPSS的數(shù)據(jù)管理(數(shù)據(jù)輸入,編輯,保存)啟動(dòng)SPSS 后,出現(xiàn)的界面是數(shù)據(jù)編輯器窗口(如圖1-3所示),它的底部有兩個(gè)標(biāo)簽:Data View(數(shù)據(jù)視圖)和Varia

12、ble View(變量視圖),它們提供了一種類似于電子表格的方法,用以產(chǎn)生和編輯SPSS 數(shù)據(jù)文件。Data View 用于查看、錄入和修改數(shù)據(jù),Variable View定義和修改變量的定義。如果使用過電子表格,如Microsoft Excel 等,那么數(shù)據(jù)編輯窗口的許多功能應(yīng)該已經(jīng)熟悉。但是,還有一些明顯區(qū)別:1)列是變量,即每一列代表一個(gè)變量(Variable)或一個(gè)被觀測(cè)量的特征。例如問卷上的每一項(xiàng)就是一個(gè)變量。2)行是觀測(cè),即每一行代表一個(gè)個(gè)體、一個(gè)觀測(cè)、一個(gè)樣品,在SPSS 中稱為事件(Case)。例如,問卷上的每一個(gè)人就是一個(gè)觀測(cè)。3)單元包含值,即每個(gè)單包括一個(gè)觀測(cè)中的單個(gè)變量

13、值。單元(Cell)是觀測(cè)和變量的交叉。與電子表格不同,單元只包括數(shù)據(jù)值而不能含公式。4)數(shù)據(jù)文件是一張長(zhǎng)方形的二維表。數(shù)據(jù)文件的范圍是由觀測(cè)和變量的數(shù)目決定的??梢栽谌我粏卧休斎霐?shù)據(jù)。如果在定義好的數(shù)據(jù)文件邊界以外鍵入數(shù)據(jù),SPSS 將數(shù)據(jù)長(zhǎng)方形延長(zhǎng)到包括那個(gè)單元和文件邊界之間的任何行和列。如果要分析的數(shù)據(jù)還沒有錄入,可用數(shù)據(jù)編輯器來鍵入數(shù)據(jù)并保存為一個(gè)SPSS 數(shù)據(jù)文件(其默認(rèn)擴(kuò)展名為.sav)。 SPSS數(shù)據(jù)管理第一步,定義變量: 輸入數(shù)據(jù)前首先要定義變量。定義變量即要定義變量名、變量類型、變量長(zhǎng)度(小數(shù)位數(shù))、變量標(biāo)簽(或值標(biāo)簽)和變量的格式,步驟如下:?jiǎn)螕魯?shù)據(jù)編輯窗口中的Varia

14、ble View標(biāo)簽或雙擊列的題頭(Var),顯示(如圖1-4所示)變量定義視圖,在出現(xiàn)的變量視圖中定義變量。每一行存放一個(gè)變量的定義信息,包括名稱(Name)、類型(Type)、寬度(Width)、小數(shù)位數(shù)(Decimal)、 標(biāo)簽(Label)、數(shù)值(Value)、缺失(Missing)、列(Columns)、對(duì)齊(Align)、測(cè)量(Measure)等。圖1-4 定義變量1)名稱(Name):定義變量名變量名必須以字母或字符開頭,其他字符可以是任何字母、數(shù)字或_、#、$等符號(hào)。變量名總長(zhǎng)度不能超過8 個(gè)字符(即4 個(gè)漢字)。2)類型(Type):定義變量類型SPSS 的主要變量類型有:N

15、umeric(標(biāo)準(zhǔn)數(shù)值型)、Comma(帶逗點(diǎn)的數(shù)值型)、Dot(逗點(diǎn)作小數(shù)點(diǎn)的數(shù)值型)、Scientific Notation(科學(xué)記數(shù)法)、Date(日期型)、Dollar(帶美元符號(hào)的數(shù)值型)、Custom Currency(自定義型)、String(字符型)。單擊Type相應(yīng)單元中的按鈕,顯示如圖1-5所示的對(duì)話框,選擇合適的變量類型并單擊OK。圖1-5 定義變量類型對(duì)話框3)寬度Width:變量長(zhǎng)度設(shè)置數(shù)值值變量的長(zhǎng)度,當(dāng)變量為日期型時(shí)無效。4)小數(shù)位數(shù)Decimal:變量小數(shù)點(diǎn)位數(shù)設(shè)置數(shù)值值變量的小數(shù)點(diǎn)位數(shù),當(dāng)變量為日期型時(shí)無效。5)標(biāo)簽Label:變量標(biāo)簽變量標(biāo)簽是對(duì)變量名的進(jìn)一

16、步描述,變量只能由不超過8 個(gè)字符組成,8 個(gè)字符經(jīng)常不足以表示變量的含義。而變量標(biāo)簽可長(zhǎng)達(dá)120 個(gè)字符,變量標(biāo)簽對(duì)大小寫敏感,顯示時(shí)與輸入值完全一樣,需要時(shí)可用變量標(biāo)簽對(duì)變量名的含義加以解釋。6)數(shù)值Value:變量值標(biāo)簽值標(biāo)簽是對(duì)變量的每一個(gè)可能取值的進(jìn)一步描述,當(dāng)變量是定類或定序變量時(shí),這是非常有用的。單擊數(shù)值Value相應(yīng)單元,在如圖1-6所示的對(duì)話框中進(jìn)行設(shè)置。圖1-6 修改變量標(biāo)簽和值標(biāo)簽7)缺失Missing:缺失值的定義方式SPSS 有兩類缺失值:系統(tǒng)缺失值和用戶缺失值。在數(shù)據(jù)長(zhǎng)方形中任何空的數(shù)字單元都被認(rèn)為系統(tǒng)缺失值,用點(diǎn)號(hào)(·)表示。SPSS 可以指定那些由于特

17、殊原因造成的信息缺失值,然后將它們標(biāo)為用戶缺失值,統(tǒng)計(jì)過程識(shí)別這種標(biāo)識(shí),帶有缺失值的觀測(cè)被特別處理。默認(rèn)值為沒有缺失值None。單擊缺失Missing相應(yīng)單元中的按鈕,可改變?nèi)笔е刀x方式,如圖1-7所示。圖1-7 改變?nèi)笔е档亩x方式8)列Column:變量的顯示寬度輸入變量的顯示寬度,默認(rèn)為8。9)對(duì)齊Align:變量顯示的對(duì)齊方式選擇變量值顯示時(shí)的對(duì)齊方式:Left(左對(duì)齊)、Right(右對(duì)齊)、Center(居中對(duì)齊)。10)測(cè)量Scale:變量的測(cè)量尺度正如前面所說的,變量按測(cè)量精度可以分為定類變量、定序變量、定距變量和定比變量,定距變量和定比變量經(jīng)常不加以區(qū)別。如果變量為定距變量

18、或定比變量,則在測(cè)量Scale相應(yīng)單元的下拉列表中選擇尺度Scale;如果變量為定序變量,則選擇序數(shù)Ordinal;如果變量為定類變量,則選擇名稱Nominal。如果有許多個(gè)變量的類型相同,可以先定義一個(gè)變量,然后把該變量的定義信息復(fù)制給新變量。具體操作為:先定義一個(gè)變量,在該變量的行號(hào)上單擊右鈕,彈出如圖1-8所示的快捷菜單,選擇拷貝Copy;然后用鼠標(biāo)右鈕選擇多行,彈出如圖1-9所示的快捷菜單,選擇粘貼Paste;再把自動(dòng)產(chǎn)生的新變量名稱(如Var0001、Var0002、Var0003、)改為所要的變量名稱。圖1-8 拷貝圖1-9 粘貼定義了所有變量后,單擊Data View即可在數(shù)據(jù)視圖中輸入數(shù)據(jù)。SPSS數(shù)據(jù)管理第二步,數(shù)據(jù)的輸入與編輯:定義了變量后就可以輸入數(shù)據(jù)了,數(shù)據(jù)窗口如圖1-10所示。圖1-10 數(shù)據(jù)文件編輯窗口在數(shù)據(jù)輸入和編輯過程中,可用方向鍵或鼠標(biāo)移動(dòng)到要修改的單元,鍵入新值。如果數(shù)據(jù)文件較大且知道要修改的數(shù)據(jù)單元的行號(hào),可通過選擇數(shù)據(jù)

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論