下載本文檔
版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)
文檔簡介
1、第一章1.SPSS是軟件英文名稱的首字母縮寫,其最初為Statistical Package for the Social Sciences的縮寫,即“社會科學(xué)統(tǒng)計軟件包”。2.SPSS系統(tǒng)運(yùn)行管理方式(SPSS的幾種基本運(yùn)行方式)有: (1)完全窗口菜單運(yùn)行方式 (2)程序運(yùn)行管理方式 (3)混合運(yùn)行管理方式3.SPSS的界面提供的五個窗口:數(shù)據(jù)編輯窗口、結(jié)果管理窗口、結(jié)果編輯窗口、語法編輯窗口、腳本窗口。第二章1.SPSS的文件類型:語法文件(*.sps)、數(shù)據(jù)文件(*.sav)、結(jié)果輸出文件(*.spv)。2.SPSS數(shù)據(jù)編輯器的每一行數(shù)據(jù)稱為一個個案(Case),每一個數(shù)據(jù)代表個體的屬
2、性,即變量(Variable)。3.SPSS變量名的命名規(guī)則:1)必須以英文字母開頭,其他部分可以含有字母、數(shù)字、下劃線(即“-”);2)變量名盡量避免和SPSS已有的關(guān)鍵字重復(fù),例如sum、compute、anova等;3)SPSS13及以后版本支持變量名最長為64Byte,即變量名最長為64個英文字符,或者32個中文字符;4)SPSS變量名不區(qū)分大小寫,即SPSS認(rèn)為Name、name、nAme這三個變量名沒有區(qū)別。4.變量度量類型:定量(個數(shù)、高度、溫度等)、定序(“十分重要”、“重要”、“一般”、“不重要”)、定類(名字、地址、電話等)。5.列和寬度的區(qū)別:變量寬度:對字符型變量,該數(shù)
3、值決定了你能輸入的字符串的長度;列:設(shè)定該變量數(shù)據(jù)視圖中列的寬度。6.變量的值標(biāo)簽:即對數(shù)值含義的解釋。例如:值標(biāo)簽12男女7.默認(rèn)的缺失值類型:數(shù)值型類型(.)、字符串類型(空格)。8.數(shù)據(jù)文件的合并包括:縱向合并和橫向合并(合并個案和合并變量),合并變量包括一對一合并和一對多合并。9.SPSS用“(*)”表示變量來自于當(dāng)前活動數(shù)據(jù)文件中的變量,而用“(+)”表示將要和當(dāng)前數(shù)據(jù)文件進(jìn)行合并的數(shù)據(jù)文件中的變量。10.在合并數(shù)據(jù)文件之前,所有需要合并的數(shù)據(jù)文件必須預(yù)先按照關(guān)鍵變量進(jìn)行升序排列。否則,合并文件程序?qū)⑹ ?1.(選擇題)一對一合并變量時,兩個文件都要提供個案;一對多合并時,活動的和
4、非活動的文件都可以作為關(guān)鍵字。第三章1.可是離散化的作用以及兩類方法作用:可視離散化用于為定量變量創(chuàng)建分類變量,從而實現(xiàn)連續(xù)變量的離散化。在統(tǒng)計分析中,有時候需要了解總體的大致分布狀況,而不需要了解屬性的具體信息。兩類方法:直接輸入分割點(diǎn)和根據(jù)條件自動生成分割點(diǎn)。2.數(shù)據(jù)缺失的可能原因,缺失值的定義以及如何處理缺失值?1)原因:在數(shù)據(jù)收集階段,收集者沒有收集到相應(yīng)數(shù)據(jù);應(yīng)答著拒絕回答該問題,比如該問題涉及個人隱私;該問題對該應(yīng)答者不適用,比如該問題是針對女性的,而應(yīng)答者為男性。2)定義:缺失值是指粗糙數(shù)據(jù)中由于缺少信息而造成的數(shù)據(jù)的聚類,分組,刪失或截斷。它指的是現(xiàn)有數(shù)據(jù)集中某個或某些屬性的值
5、是不完全的。3)如何處理:首先應(yīng)該想到重新回到數(shù)據(jù)收集階段盡量收集到該數(shù)據(jù),如果實在收集不到該數(shù)據(jù),再考慮怎么處理缺失值,如果缺失數(shù)據(jù)不影響到具體的統(tǒng)計分析,則不對缺失值作任何處理(即缺失數(shù)據(jù)還是作為缺失數(shù)據(jù)處理),如果缺失數(shù)據(jù)影響到了具體的統(tǒng)計分析,則必須考慮采取適當(dāng)方法來填補(bǔ)缺失數(shù)據(jù)。3.SPSS提供的填補(bǔ)缺失值的方法有哪些?(作簡要說明)1)序列均值為取整列數(shù)據(jù)的均值;2)臨近點(diǎn)均值為去該缺失值臨近的幾個點(diǎn)的均值,具體幾個點(diǎn)由附近點(diǎn)的跨度來設(shè)定;3)臨近點(diǎn)的中位數(shù)為取該缺失值鄰近的幾個點(diǎn)的中位數(shù),具體幾個點(diǎn)由附近點(diǎn)的跨度來設(shè)定;4)線性插值法應(yīng)用線性插值法填補(bǔ)缺失值。用該列數(shù)據(jù)缺失值前一
6、個數(shù)據(jù)和后一個數(shù)據(jù)建立插值直線,然后用缺失點(diǎn)在線性插值函數(shù)的函數(shù)值填充該缺失值;5)點(diǎn)處的線性趨勢法應(yīng)用缺失值所在的整個序列建立線性回歸方程,然后用該回歸方程在缺失點(diǎn)的預(yù)測值填充缺失值。4.什么叫數(shù)據(jù)校驗,作用是什么?數(shù)據(jù)校驗即查找錯誤數(shù)據(jù)或者不一致數(shù)據(jù)的過程。作用:如果數(shù)據(jù)沒有收集到則盡量想辦法補(bǔ)全;如果是錄入錯誤則重新錄入;如果數(shù)據(jù)確實錯誤,則可將這些數(shù)據(jù)設(shè)置成缺失值(即丟棄這些數(shù)據(jù)不進(jìn)行分析)。5.在選擇個案If對話框中,構(gòu)建選擇“男性1、黑種人2、東北地區(qū)1”的表達(dá)式:性別=1&種族=2&地區(qū)=1第四章1.統(tǒng)計分析的目的,描述性統(tǒng)計分析方法與推斷性統(tǒng)計分析方法有什么不同
7、?目的:是研究觀察對象總體的特點(diǎn)。區(qū)別:描述性統(tǒng)計分析方法是指應(yīng)用分類、制表、圖形以及概括性數(shù)據(jù)指標(biāo)(如均值、方差)來概括數(shù)據(jù)分布特征的方法。兒推斷性統(tǒng)計分析方法則是通過隨機(jī)抽樣,應(yīng)用統(tǒng)計方法把從樣本數(shù)據(jù)得到的結(jié)論推廣到總體的數(shù)據(jù)分析方法。2.描述數(shù)據(jù)特征的統(tǒng)計量的兩大類:一類表示數(shù)據(jù)的中心位置,另一類表示數(shù)據(jù)的離散程度。3.比較均值、中位數(shù)、眾數(shù)的區(qū)別與聯(lián)系。均值:用于數(shù)值型的數(shù)據(jù),不能用于定類、定序型數(shù)據(jù);易受極端值的影響;中位數(shù):主要用于定序數(shù)據(jù),不能用于定類數(shù)據(jù);不受極端值影響;眾數(shù):主要用于定類數(shù)據(jù);不受極端值影響;可能沒有眾數(shù)或多個眾數(shù)。對于數(shù)據(jù)變量和定序變量,可以用均值、中位數(shù)、
8、眾數(shù);對于定類數(shù)據(jù),只有眾數(shù)。4.對極差、方差、標(biāo)準(zhǔn)差作解釋。極差反映了變量的變異范圍或離散幅度,在相同樣本容量的兩組數(shù)據(jù)中,全距大的一組數(shù)據(jù)比全距小的一組數(shù)據(jù)要分散。方差和標(biāo)準(zhǔn)差越大,變量值之間的差異越大,距離平均數(shù)這個“中心”離散越大;越小,則這些數(shù)據(jù)更接近平均值。5.分位數(shù)的類型,各自的含義。四分位差是什么,大小說明什么?P100;四分位數(shù)將觀測數(shù)值按從小到大進(jìn)行排序,然后分成四等份,出于三個分割點(diǎn)位置的觀測值就是四分位數(shù),即Q1.Q2.Q3;十分位數(shù)將觀測數(shù)值按從小到大進(jìn)行排序,然后分成十等份,出于九個分割點(diǎn)位置的觀測值就是十分位數(shù),即D1.D2.D3.D9。四分位差通常為Q3和Q1的
9、差,用來衡量觀測值的離散程度,四分位差越大則說明所觀測的數(shù)據(jù)越分散,越小則說明所觀測數(shù)據(jù)越集中。6.分布的形狀有偏度和峰度。偏度是用來描述變量取值分布的偏斜方向,它衡量分布對稱與否、分布不對稱的方向和程度,取值一般在-3和3之間;峰度是用來描述變量取值分布形態(tài)陡緩程度的統(tǒng)計量,是指分布圖形的尖峭程度或峰凸程度,取值范圍可正可負(fù)可為零。7.標(biāo)準(zhǔn)化分?jǐn)?shù)也叫標(biāo)準(zhǔn)化值或Z分?jǐn)?shù),用于對變量的標(biāo)準(zhǔn)化處理。意義:變量值X,Z分?jǐn)?shù)表示大于或小于平均數(shù)幾個標(biāo)準(zhǔn)差,可用來比較從兩個不同單位抽取出來的兩值。8.統(tǒng)計圖定類型:餅圖、條形圖(【分析】【描述統(tǒng)計】【頻率】下),帕累托圖(【分析】【質(zhì)量控制】【排列圖】)。
10、數(shù)值型:莖葉圖、箱圖、直方圖(在【分析】【描述統(tǒng)計】【探索】下)。9.對莖葉圖、箱圖的解釋。莖葉圖是描述定量變量的一種圖形方式,它除了能夠給出直方圖所給出的分布的信息外,還能夠還原大部分原始數(shù)據(jù)的信息。箱圖是總結(jié)五數(shù)(最小值、第一四分位數(shù)、中位數(shù)、第三個四分位數(shù)、最大值)的圖形表現(xiàn)。(用o表示離群值,用*表示極端值,一般極端值會大一些。)(要求會讀圖,P132-133)。課后練習(xí)3.說明莖葉圖和直方圖區(qū)別。如果想盡可能展現(xiàn)原始數(shù)據(jù)的信息,應(yīng)該采用哪一種圖形?莖葉圖:莖葉圖是描述定量變量的一種圖形方式,它除了能夠給出直方圖所給出的分布的信息外,還能夠還原大部分原始數(shù)據(jù)的信息。優(yōu)點(diǎn):變量取值較多,
11、不影響其顯示效果;缺點(diǎn):如果觀測值較大,顯示效果不好。直方圖:應(yīng)用于連續(xù)型數(shù)據(jù),表現(xiàn)在圖形上直方圖的各個正方條形之間沒有任何間隔。優(yōu)點(diǎn):變量值較多,觀測值較多不影響顯示效果,概括性好,反映次數(shù)分布直觀;缺點(diǎn):有信息損失,組數(shù)的確定帶有一定的主觀性。如果想盡可能展現(xiàn)原始數(shù)據(jù)的信息,應(yīng)該采用莖葉圖。1. 利用SPSS進(jìn)行數(shù)據(jù)分析的一般步驟答:數(shù)據(jù)的準(zhǔn)備、加工整理階段:進(jìn)入SPSS,打開一個已保存的待分析的SPSS或EXEL、TXT等文件。若沒有原始數(shù)據(jù)文件,則需新建一個SPSS文件,將數(shù)據(jù)輸入新建的SPSS文件中,并及時保存。數(shù)據(jù)的預(yù)分析階段:根據(jù)設(shè)計初步判斷可以用到的檢驗方法,然后進(jìn)行必要的預(yù)分
12、析(分布圖、均數(shù)和標(biāo)準(zhǔn)差的描述等),其操作步驟為分析描述性統(tǒng)計選擇必要的描述性分析方法,以確定數(shù)據(jù)是否滿足方法要求,最終選擇一種合適的檢驗方法。數(shù)據(jù)的分析階段:然后在分析中按上一步的結(jié)論選擇分析方法并進(jìn)行統(tǒng)計分析。保存和導(dǎo)出分析結(jié)果,對分析結(jié)果進(jìn)行閱讀和解釋。2.常用的統(tǒng)計圖表有:條圖:匯總分類變量,用以描述按性質(zhì)分組的各組某項指標(biāo)值的大小。餅圖:比較比例,用以描述百分比(構(gòu)成比)資料;散點(diǎn)圖:用于表示雙數(shù)值變量之間的相關(guān)關(guān)系以及某變量的格值分布。直方圖:用以描述一組定量變量資料的頻數(shù)分布,顯示單個刻度變量的分布情況。箱圖:顯示五個統(tǒng)計量(最小值(P2.5)、第一個四分位(P25)、中位數(shù)(P
13、50)、第三個四分位(P75)和最大值(P97.5))。該圖對于顯示刻度變量的分布情況并確定離群值的位置非常有用。3. 題目:按照一個條件來找滿足該條件的觀測,年齡在50歲以上的女性。答:方法一:打開相應(yīng)的SPSS文件,定義值標(biāo)簽,1=”男”,2=”女”;點(diǎn)擊轉(zhuǎn)換計算變量點(diǎn)擊“如果”,彈出對話框;選擇“如果個案滿足條件則包括()”,鍵盤輸入:age>50 and gender=2,點(diǎn)擊繼續(xù); 在目標(biāo)變量框中鍵入新變量如selected,=后邊的數(shù)學(xué)表達(dá)式框中鍵入1,點(diǎn)擊確定。彈出對話框“是否更改現(xiàn)有的變量?”,點(diǎn)擊確定,即可完成。查看更改后的數(shù)據(jù)的最后一列“selected”,值為1的即
14、為選中的變量。方法二:打開相應(yīng)的SPSS文件,定義值標(biāo)簽,1=”男”,2=”女”;點(diǎn)擊數(shù)據(jù)選擇個案如果條件滿足,彈出對話框;在條件表達(dá)式對話框中輸入:age>50 and gender=2,點(diǎn)擊繼續(xù);再點(diǎn)擊確定即可。在更改的數(shù)據(jù)視圖中,未標(biāo)有黑色斜杠的即為選擇的個案。4.試說明下列結(jié)果的分析過程?(這個題很有可能考,大家最好自己操作一下啊)1、 第一步:選擇“數(shù)據(jù)”à“拆分文件”,在“分割文件”對話框中,首先將變量“marital”從原變量列表中選入“分組方式”列表中,然后將變量“gender”從原變量列表中選入“分組方式”列表中,然后點(diǎn)擊“確定”。2、 第二部:選擇“分析”
15、à“描述統(tǒng)計” à“頻率”,然后在“頻率”對話框中,將變量“retire”選入目標(biāo)變量列表中,點(diǎn)擊確定。1.ArithmeticFunctions算術(shù)函數(shù)算術(shù)函數(shù)是最常用的函數(shù),可以滿足對變量進(jìn)行的一般運(yùn)算,算術(shù)函數(shù)主要有:函數(shù)名自變量涵義函數(shù)類型函數(shù)功能及說明ABS(numexpr)(算術(shù)表達(dá)式)數(shù)值型函數(shù)求絕對值,例如:ABS(Y-850):將分別計算變量Y的每個數(shù)據(jù)與20的差的絕對值A(chǔ)RSIN(numexpr)(角度;弧度單位)數(shù)值型函數(shù)求反正弦值,例如:ARSIN(1)= /2 ARTAN(numexpr)(角度;弧度單位)數(shù)值型函數(shù),求反正切值,例如ARTAN(1
16、)= /4: COS(radians)(角度;弧度單位)數(shù)值型函數(shù)求余弦值,例如:COS()= -1EXP(numexPr)(算術(shù)表達(dá)式) 數(shù)值型函數(shù)求e的指數(shù)冪值。例如:Exp(4)=e4=54.60。注意:若函數(shù)值太大,其結(jié)果會超出SPSS的計算范圍。LGl0(numexp)(算術(shù)表達(dá)式)數(shù)值型函數(shù)求以10為底的對數(shù)值。例如:Ln(Y):分別計算變量Y中每個數(shù)據(jù)的以10 為底的對數(shù)值LN(numexpr)(算術(shù)表達(dá)式) 數(shù)值型函數(shù)求以e為底的對數(shù)。例如:Ln(Y):分別計算變量Y中每個數(shù)據(jù)的自然對數(shù)值MOD(numexpr,modulus)(算術(shù)表達(dá)式;摸數(shù)(常數(shù)))數(shù)值型函數(shù)求算術(shù)表達(dá)式
17、除以模數(shù)的余數(shù)。例如:Mod(103):函數(shù)值1SIN(radians)(角度;弧度單位)數(shù)值型函數(shù)求正弦值。例如:Sin()= 0SQRT(numexpr)(正數(shù))數(shù)值型函數(shù)求平方根。例如:Sqrt(9)=3RND(numexpr)(算術(shù)表達(dá)式)數(shù)值型函數(shù)求算術(shù)表達(dá)式的值四舍五入后的整數(shù)。例如:RND(2.72)3TRUNC(numexpr)(算術(shù)表達(dá)式)數(shù)值型函數(shù)求算術(shù)表達(dá)式的值被截去小數(shù)部分的整數(shù)。例如:Trunc(2.72)2算術(shù)表達(dá)式也包括單值與變量名的情況。2.StatisticalFunctions統(tǒng)計函數(shù)統(tǒng)計函數(shù)也是統(tǒng)計分析中常用的函數(shù)之一,主要反映變量的數(shù)據(jù)特征,時間序列的滯
18、后期變量等,具體函數(shù)有:函數(shù)名自變量涵義函數(shù)類型函數(shù)功能與說明CFVAR(numexpr,numexpr,.)(變量名,變量名,.)數(shù)值型函數(shù)求出多個變量值的變異系數(shù)(標(biāo)準(zhǔn)差/均值) 。例如Cfvar(數(shù)學(xué),物理,化學(xué)):分別計算每個學(xué)生三門成績的變異系數(shù)LAG(variable)(變量名)數(shù)值型函數(shù)或字符型函數(shù)返回滯后一期的變量數(shù)據(jù)。對第一個觀測量來說,將返回系統(tǒng)缺失值,如果指定的變量是字符型,則返回空格。LAG(variable,ncases)(變量名,自然數(shù)n)數(shù)值型函數(shù)返回滯后n期的變量數(shù)據(jù)。對第前n個觀測量來說,將返回系統(tǒng)缺失值,如果指定的變量是字符型,則返回空格。MAX(ivalue,value,.)(變量名,變量名,)數(shù)值型函數(shù)求多個變量值中的最大值;例如MAX(數(shù)學(xué),物理,化學(xué)):分別計算每個學(xué)生三門成績中的最高分MEAN(numexpr,numexpr,.)(變量名,變量名,)數(shù)值型函數(shù)求多個變量值的平均值;例如MEAN(數(shù)學(xué),物理,化學(xué)):分別計算每個學(xué)生三門成績的平均值MIN(value,value,.)(變量名,變量名,)數(shù)值型函數(shù)求多個變量值
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 航運(yùn)行業(yè)保安工作總結(jié)
- 北京市安全管理工作總結(jié)
- 銀行工作總結(jié)團(tuán)結(jié)合作追求卓越
- 2023-2024學(xué)年北京市101中學(xué)高一(下)期中語文試卷
- 家具行業(yè)招聘成功案例
- 娛樂設(shè)施行業(yè)推廣計劃總結(jié)
- 醫(yī)療話務(wù)員工作總結(jié)
- 醫(yī)學(xué)美容診所前臺工作總結(jié)
- 2024年認(rèn)識安全標(biāo)志的教案
- 涼亭制定安裝協(xié)議書(2篇)
- 2022年天津三源電力集團(tuán)限公司社會招聘33人上岸筆試歷年難、易錯點(diǎn)考題附帶參考答案與詳解
- 2023-2024學(xué)年廣東廣州番禺區(qū)四年級數(shù)學(xué)第一學(xué)期期末綜合測試試題含答案
- 抑郁病診斷證明書
- 對話大國工匠-致敬勞動模范期末考試答案
- 財務(wù)總監(jiān)績效考核表
- 壓縮語段之語段要點(diǎn)概括公開課一等獎市優(yōu)質(zhì)課賽課獲獎?wù)n件
- 數(shù)字孿生水利工程建設(shè)技術(shù)導(dǎo)則(試行)
- 砌筑工程安全監(jiān)理制度
- 工商企業(yè)管理畢業(yè)論文 工商企業(yè)管理5000論文范文四篇
- 職業(yè)病危害風(fēng)險管理
- 接線端子規(guī)格大全
評論
0/150
提交評論