地理學(xué)模型方法及應(yīng)用_第1頁
地理學(xué)模型方法及應(yīng)用_第2頁
地理學(xué)模型方法及應(yīng)用_第3頁
地理學(xué)模型方法及應(yīng)用_第4頁
地理學(xué)模型方法及應(yīng)用_第5頁
已閱讀5頁,還剩47頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

地理學(xué)模型方法及應(yīng)用第一頁,共五十二頁,編輯于2023年,星期五一、SPSS統(tǒng)計(jì)軟件應(yīng)用基礎(chǔ)第二頁,共五十二頁,編輯于2023年,星期五一、數(shù)據(jù)輸入1.Name變量名稱:首字必須是字母、變量名不多于8個(gè)字符。2.Type數(shù)據(jù)變量類型:Numeric標(biāo)準(zhǔn)、String字符、Date日期3.Width變量格式寬度:指數(shù)據(jù)窗口中變量列所占單元格的列寬度。不同于變量寬度。若變量寬度>變量格式寬度,在數(shù)據(jù)窗口中顯示變量名的字符數(shù)不夠,變量名將被截去尾部而不完全顯示。輸入的數(shù)據(jù)可能截去尾部,用“*”號(hào)代替。4.Decimals小數(shù)位數(shù)第三頁,共五十二頁,編輯于2023年,星期五5.Label變量標(biāo)簽:是對(duì)變量的附加說明。6.Value值標(biāo)簽:是對(duì)變量的可能取值附加的進(jìn)一步說明。如果將它定義為一個(gè)數(shù)字型變量,在值標(biāo)簽開關(guān)開啟時(shí),要輸入部門名稱,只需要輸入它的值,就可顯示出值標(biāo)簽。7.Missing缺失值:指沒測到、沒記錄到、或結(jié)果明顯錯(cuò)誤的數(shù)據(jù)。系統(tǒng)默認(rèn)的數(shù)值型缺失值為0,字符型缺失值為空格,我們也可自定義缺失值。如把小麥畝產(chǎn)量大于1500公斤的數(shù)據(jù)記為缺失值。8.Alignment單元格對(duì)齊格式:有左中右之分。9.Measurement測度:Scale定比測度(取值于一個(gè)區(qū)間或連續(xù)變量,如身高、收入),Ordinal定序測度(無論是數(shù)字型還是字符型,只要有順序分類,如大中小、優(yōu)良中差),Nominal定類測度(若是不具有某種內(nèi)在順序分類的字符型變量,如地理區(qū)域的劃分、公司部門等,可設(shè)置為Nominal測度)。第四頁,共五十二頁,編輯于2023年,星期五二、數(shù)據(jù)標(biāo)準(zhǔn)化1.標(biāo)準(zhǔn)化公式:Zi=(xi-x均)/s其中:x均為算術(shù)平均值;s為標(biāo)準(zhǔn)差(樣本方差)S=[1/(n-1)Σ(xi-x均)2]1/22.方法Analyze→DescriptiveStatistics→Descriptives,打開Descriptives對(duì)話框,選SaveStandardizedValueVariables三、方差分析(一)單因素方差分析及其原理1.在科學(xué)研究中,需要在諸多因素中,分析哪些因素對(duì)該事物有顯著影響?影響因素如何搭配效果最佳?影響因素間是否有交互作用?方差分析就是處理這類問題的統(tǒng)計(jì)分析方法。第五頁,共五十二頁,編輯于2023年,星期五2.單因素方差分析基本原理研究因素影響是否顯著,就是檢驗(yàn)如下假設(shè):H0:μ1=μ2=…=μr當(dāng)p<0.05(系統(tǒng)默認(rèn)的顯著性概率值)時(shí),推翻原假設(shè),認(rèn)為這些因素的影響是顯著的,說明這些因素造成的均值差異有統(tǒng)計(jì)意義;否則認(rèn)為影響是不顯著的。3.方法Analyze→CompareMeans→One-WayAnalysisofVariance。分別輸入因變量DependentList和因素變量Factor。Significanceleve確定顯著性水平,一般選0.1,0.05,0.01,系統(tǒng)默認(rèn)的顯著性概率為0.05。4.結(jié)果分析表中第一列為方差來源:①組間(由于因素不同水平或位級(jí)所造成的差異);②組內(nèi)(由于偶然或不可控制的隨機(jī)因素所造成的差異);③總平方和。表中第一行:平方和;df為自由度;均方;F為組間均方除以組內(nèi)均方的商;Sig.為F分目的顯著性概率。第六頁,共五十二頁,編輯于2023年,星期五(二)單變量多因素方差分析研究一個(gè)因變量與多個(gè)獨(dú)立自變量或因素間的關(guān)系。1.多因素方差分析基本原理研究因素影響是否顯著,就是檢驗(yàn)各因素及它們之間的交互作用對(duì)總體均值影響是否顯著,即檢驗(yàn)如下假設(shè)均方差:H0A=σ1=σ2=…=σr;H0B=β1=β2=…=βr;

H0A×B=γ1=γ2=…=γr;2.方法Analyze→GeneralLinearModel→Univariate分別輸入因變量DependentList和多個(gè)不變因素FixedFactor3.結(jié)果分析有2個(gè)表:表①為主因素變量信息表(Between-SubjectsFactors),含變量取值及頻數(shù)N。第七頁,共五十二頁,編輯于2023年,星期五表②為主效應(yīng)方差分析表(TestsofBetween-SubjectsEffects).表中第一行分別為:Source為方差來源;TypeⅢSume為按系統(tǒng)默認(rèn)Ⅲ型草方和計(jì)算出的離差平方和;df為自由度;MeanSquare為均方,即平方和與自由度之商;F為[Σ(xi-x均)2]1/2與[Σ隨機(jī)誤差平方和]1/2之比;Sig.為接受原假設(shè)的顯著性概率。表中第一列分別為:修正模型;截距平方和(截距指線性模型中的截距);因素1;因素2;因素1*因素2交互效應(yīng);誤差;因變量的總平方和;修正模型的總平方和。三、相關(guān)分析1.二元變量相關(guān)分析方法:Analyze→Correlate→Bivariate(二元變量),選了Flagssignificantecorrelations項(xiàng),顯著水平0.05以下顯著相關(guān)的相關(guān)系數(shù)用*標(biāo)記,顯著水平0.01以下顯著相關(guān)的相關(guān)系數(shù)用**標(biāo)記。Pearson皮爾遜相關(guān)系數(shù)(|Rxy|≤1):Rxy=Σ(xi-x均)(yi-y均)/[Σ(xi-x均)2Σ(yi-y均)2]1/2第八頁,共五十二頁,編輯于2023年,星期五Kendall’stau-b為肯德爾秩相關(guān)系數(shù)。Spearman為斯皮爾曼秩相關(guān)系數(shù)。Two-tailed為雙尾假設(shè)檢驗(yàn)。One-tailed為單尾假設(shè)檢驗(yàn)。2.偏相關(guān)分析2.1偏相關(guān)系數(shù)定義指當(dāng)其他變量被固定,給定的任意兩個(gè)變量之間的相關(guān)系數(shù)。偏相關(guān)系數(shù)才是真正反映兩個(gè)變量的相關(guān)關(guān)系的統(tǒng)計(jì)量。在多元分析相關(guān)分析中,Pearson皮爾遜相關(guān)系數(shù)只是從表面上反映兩變量相關(guān)的性質(zhì),往往不能真實(shí)反映,甚至造成相關(guān)的假象。2.2方法Analyze→Correlate→PartialCorrelations(偏相關(guān))輸入兩個(gè)或兩個(gè)以上需要進(jìn)行相關(guān)分析的變量移入Variable框內(nèi)。再輸入至少1個(gè)控制變量移入控制變量欄?;騼蓚€(gè)以上需要進(jìn)行相關(guān)分析的變量移入Variable框內(nèi)。第九頁,共五十二頁,編輯于2023年,星期五選了Displayactualsigificance項(xiàng),在顯示相關(guān)系數(shù)的同時(shí),也顯示相關(guān)系數(shù)的實(shí)際顯著性概率和自由度。如果不選,顯著水平0.05以下顯著相關(guān)的相關(guān)系數(shù)用*標(biāo)記,顯著水平0.01以下顯著相關(guān)的相關(guān)系數(shù)用**標(biāo)記。四、回歸分析1.線性回歸分析1.1方法

Analyze→Regression→Linear。輸入兩個(gè)或兩個(gè)以上需要進(jìn)行相關(guān)分析的變量移入Variable框內(nèi)。再輸入至少1個(gè)控制變量移入控制變量欄。或兩個(gè)以上需要進(jìn)行相關(guān)分析的變量移入Variable框內(nèi)?;貧w模型中自變量進(jìn)入方式選擇:Enter為自變量全部進(jìn)入;Stepwise為逐步回歸;Remove為移除法,根據(jù)設(shè)定的條件剔除部分自變量;Backward向后剔除法,先將所有變量引入方程,再據(jù)F值逐一剔除;Forward第十頁,共五十二頁,編輯于2023年,星期五向前剔除法,先將按偏相關(guān)系數(shù)最大的入,再引入次大的,直至將所有符合條件的變量全部引入方程為止。選項(xiàng)按鈕中Statistic中Cofidenceintervals為回歸系數(shù)B的95%置信區(qū)間。打開Plots按鈕,選Produceallpartialplots繪制出散點(diǎn)圖。打開Save按鈕,選PredicatedValues中的非標(biāo)準(zhǔn)化或標(biāo)準(zhǔn)化的預(yù)測值。選Residuals保存殘差。1.2結(jié)果分析(回歸方程的建立)2.非線性回歸分析Analyze→Regression→noLinear第十一頁,共五十二頁,編輯于2023年,星期五3.曲線估計(jì)3.1方法Analyze→Regression→CureEstimation3.2線型模型的選擇方法線性模型,二次,復(fù)合y=a(b)t,生長曲線y=exp(a+bt),對(duì)數(shù)曲線y=a+blnt,三次曲線,S曲線y=exp(a+b/t),指數(shù)曲線y=aexp(bt),逆曲線y=a+b/t,冪指曲線y=a(t)b,邏輯曲線y=[1/u+a(b)t],選邏輯曲線時(shí),必須在被激活的Upperbound框中輸入u>0,且必須大于因變量的最大值,稱u為上界。五、非參數(shù)檢驗(yàn)5.1單個(gè)樣本K-S檢驗(yàn):可檢驗(yàn)一個(gè)樣本是否服從正態(tài)、泊松、均勻和指數(shù)分布。5.1.1方法Analyze→NonparametricTests→1-SampleK-S打開One-sampleKolmogorov-SmirnovTest對(duì)話框。第十二頁,共五十二頁,編輯于2023年,星期五5.1.2檢驗(yàn)概率分布選擇方法Normal:正態(tài)分布;Poisson:泊松分布;Uniform:均勻分布;Exponetial:指數(shù)分布。5.1.3結(jié)果分析方法N:樣本總數(shù);Normalparameter(正態(tài)分布參數(shù)):均值,標(biāo)準(zhǔn)差;MostExtremeDifferences(最大的):絕對(duì)值,最大正極端差,最大負(fù)極端;Kolmogorov-SmirnovZ:K-S檢驗(yàn)統(tǒng)計(jì)量Z值;Asymp.Sig.(2-tailed):雙尾漸進(jìn)顯著性概率(大于0.05接受原假設(shè),即μ=μ0,服從正態(tài)分布)。5.2多個(gè)獨(dú)立樣本檢驗(yàn):可檢驗(yàn)多個(gè)獨(dú)立樣本是否來自具有相同分布總體的樣本。(若多個(gè)樣本來自等方差的正態(tài)總體時(shí),才能用方差分析檢驗(yàn))5.2.1方法Analyze→NonparametricTests→KIndependentSample第十三頁,共五十二頁,編輯于2023年,星期五5.2.2檢驗(yàn)方法選擇有兩種方法可選①克魯凱-沃里斯H檢驗(yàn);中位數(shù)檢驗(yàn)Median。5.2.3結(jié)果分析方法例1從某車間使用的4種不同操作方法下生產(chǎn)的產(chǎn)品中,分別抽查若干批進(jìn)行檢驗(yàn),測得被抽查的各批產(chǎn)品的優(yōu)等品率(%)的數(shù)據(jù)資料見表.試檢驗(yàn)不同操作方法對(duì)產(chǎn)品優(yōu)等品率有無顯著影響。H檢驗(yàn)有2個(gè)表:表1為平均秩(Ranks)表;表2為H檢驗(yàn)結(jié)果表:①卡方統(tǒng)計(jì)量值為11.53,自由度df為3;②漸進(jìn)顯著性概率Sig.為0.009<0.05。因此認(rèn)為這4種不同操作方法對(duì)產(chǎn)品優(yōu)等品率有顯著影響(拒絕原假設(shè):4種樣本屬同分布)。第十四頁,共五十二頁,編輯于2023年,星期五六、聚類分析與判別分析分類問題可分為兩種:

一種是事先不知道應(yīng)將樣品(Q-型聚類)、或指標(biāo)(R-型聚類)分為幾類,需要根據(jù)樣品或變量的相似程度,歸組并類,這種分類問題用聚類分析法(ClusterAnalysis)解決;

第二種是事先已經(jīng)建立了分類,然后將新樣品按照已知類別進(jìn)行歸類,解決這種分類問題用判別分析法(DiscriminantAnalysis)

。㈠聚類分析聚類分析分為動(dòng)態(tài)聚類分析法、系統(tǒng)聚類分析法等。

動(dòng)態(tài)聚類法也稱為快速聚類法,或K-均值聚類法(K-MeansCluster),快速聚類的思想是:開始按照一定方法選取一批聚類中心(ClusterCenter),讓樣品向最近的聚心凝聚,形成初始分類,然后按最近距離原則不斷修改不合理分類,直至合理為止。第十五頁,共五十二頁,編輯于2023年,星期五

系統(tǒng)聚類分析法也稱為分層聚類法(HierarchicalCluster),分層聚類的思想是:開始將樣品或指標(biāo)各視為一類,根據(jù)類與類之間的距離或相似程度將最相似的類加以合并,再計(jì)算新類與其它類之間的相似程度,并選擇最相似的類加以合并,這樣每合并一次就減少一類,不斷繼續(xù)這一過程,直到所有樣品或指標(biāo)合并為一類為止。1.快速聚類分析(K-均值聚類法)⑴方法(以10湖泊水質(zhì)評(píng)價(jià)為例)例2將聚類分析法用于湖泊富營養(yǎng)化評(píng)價(jià)。有10個(gè)湖泊樣本,其透明度(SD)、總氮(TN)、總磷(TP)和化學(xué)需氧量(COD)等參數(shù)的標(biāo)準(zhǔn)化值如表所示。①Analyze→Classify→K-MeansCluster②從源變量欄選擇一個(gè)或幾個(gè)分析變量(數(shù)字型:numeric)移入Variables框中;選擇一個(gè)字符型(String)標(biāo)記變量(lake)移入LabelCaseby框中。③在NumberofCludter小框指定聚類數(shù)(系統(tǒng)默認(rèn)聚類數(shù)為2)3。第十六頁,共五十二頁,編輯于2023年,星期五④從Method欄中選擇一種聚類方法:Iterateandclassify:系統(tǒng)默認(rèn)選項(xiàng),表示在迭代過程中不斷地更新聚類中心;Classifyonly:用初始聚類中心對(duì)觀測量進(jìn)行聚類,聚類中心始終不變。⑤單擊Iterate(迭代):在MaximumIterations右邊的文本框中,輸入一個(gè)整數(shù)限定迭代步數(shù),系統(tǒng)默認(rèn)值為10。在ConvergenceCriterion右邊的文本框中,輸入一個(gè)不超過1的正數(shù)作為判定迭代收斂的標(biāo)準(zhǔn)。缺省的收斂標(biāo)準(zhǔn)值為0.02,表示當(dāng)兩次迭代計(jì)算的聚心之間距離的最大改變量小于初始聚心間最小距離的2%時(shí)終止迭代。⑥單擊Save:Clustermembership:在工作文件中建立一個(gè)名為“gcl_1”的新變量,其值為觀測量的類別。第十七頁,共五十二頁,編輯于2023年,星期五Distancefrimclustercenter:在工作文件中建立一個(gè)名為“gcl_2”的新變量,其值為各觀測量與所屬類聚心之間的歐氏距離。⑦打開Options:彈出對(duì)話框中Statistcs指定輸出統(tǒng)計(jì)量值,包括:Initialclustercenters:系統(tǒng)默認(rèn)選項(xiàng),表示輸出初始類聚心表。ANOVAtable:輸出方差分析表。Clusterinformationforeachcase:顯示每個(gè)觀測量的聚類信息。包括各觀測量最終被聚入的類別、各觀測量與最終聚心之間的歐氏距離,以及最終聚心之間的歐氏距離。⑵結(jié)果分析①初始類聚心表Initialclustercenters②迭代史表IterationHistory:給出迭代過程中各聚心演變。表下注釋指出聚類過程經(jīng)2次就終止了。初始聚類中心之間最小距離為0.533。第十八頁,共五十二頁,編輯于2023年,星期五③樣品隸屬表Clustermembership:給出聚類后樣品所隸屬類型。Cluster列為隸屬類別,Distance列為觀測量與聚心之距離。④最終聚類中心表:給出最終的類中心之間距離。⑤每類中樣品數(shù)NumberofcaseineachCluster。2.分層聚類分析(系統(tǒng)聚類分析法)Analyze→Classify→HierarchicalCluster①從源變量欄選擇一個(gè)或幾個(gè)分析變量(數(shù)字型:numeric)移入Variables框中;選擇一個(gè)字符型(String)標(biāo)記變量(lake)移入LabelCaseby框中。②在Cluster欄中選擇聚類類型:Cases:計(jì)算觀測量之間的距離,進(jìn)行觀測量聚類。Variables:計(jì)算變量之間的距離,進(jìn)行變量聚類。③在Display欄中選擇顯示內(nèi)容,其中兩項(xiàng)皆為系統(tǒng)默認(rèn)選項(xiàng):第十九頁,共五十二頁,編輯于2023年,星期五Statistics:顯示統(tǒng)計(jì)量,不選此項(xiàng),對(duì)話框下

Statistics按鈕將被關(guān)閉。Plots:顯示圖形,不選此項(xiàng),對(duì)話框下Plots按鈕將被關(guān)閉。④單擊Statistics按鈕:在Cludtermembership(樣品隸屬類型)欄中包括3個(gè)選項(xiàng):None:不輸出樣品隸屬類表,為系統(tǒng)默認(rèn)選項(xiàng)。Singlesolution:選擇此項(xiàng)并在右邊的Cludters文本框中指定輸出分類個(gè)數(shù)n(大于1的整數(shù)),則將輸出各樣品或變量隸屬n類的隸屬表。Rangeof

solutions:選擇此項(xiàng)并在下邊的From_though_clusters的兩個(gè)小框中輸入兩個(gè)數(shù)m和n(2≤m<n),則將輸出各樣品或變量的分類數(shù)從m到n的所有(m-n類)分類的隸屬表。第二十頁,共五十二頁,編輯于2023年,星期五⑤單擊Plot按鈕:Dendrogram:龍骨圖,選擇此項(xiàng)輸出反映聚類結(jié)果的龍骨圖。在Icile(冰柱圖)欄中有3個(gè)選項(xiàng):Allclusters:顯示全部聚類結(jié)果的冰柱圖。Specifiedrangeclusters:限制聚類解范圍,在下面的Start(開始)、Stop(終止)、By(步長)的3個(gè)小框中分別輸入3個(gè)正整數(shù)值m、n、k(m≤n,k≤n),表示從最小聚類解m開始,以增加量k為步長,到最大聚類解n為止。None:不輸出冰柱圖。⑥單擊Method按鈕,打開聚類方法選擇對(duì)話框。⑦單擊Save按鈕打開保存新變量對(duì)話框,其中ClusterMemembership欄中三個(gè)選項(xiàng)與統(tǒng)計(jì)量對(duì)話框中的相應(yīng)選項(xiàng)意義相同:None:不保存樣品隸屬類表,為系統(tǒng)默認(rèn)選項(xiàng)。第二十一頁,共五十二頁,編輯于2023年,星期五Singlesolution:選擇此項(xiàng)并在右邊的Cludters文本框中指定保存分類個(gè)數(shù)n(大于1的整數(shù)),則將保存各樣品或變量隸屬n類的隸屬表。Rangeof

solutions:選擇此項(xiàng)并在下邊的From_though_clusters的兩個(gè)小框中保存兩個(gè)數(shù)m和n(2≤m<n),則將保存各樣品或變量的分類數(shù)從m到n的所有(m-n類)分類的隸屬表。第二十二頁,共五十二頁,編輯于2023年,星期五㈡判別分析概念:事先已建立了分類,將新樣品歸為已知類別。方法:Analyze→Classify→Discriminant第二十三頁,共五十二頁,編輯于2023年,星期五七、因子分析概念:觀測數(shù)據(jù)指標(biāo)太多,且眾多變量間可能存在著相關(guān)性,實(shí)測數(shù)據(jù)包含的信息可能是重復(fù)的。因子分析法就是在盡可能不損失或少損失信息的情況下,將多個(gè)變量減少為少數(shù)幾個(gè)潛在因子(datareduction降維)。7.1方法:例3根據(jù)江蘇省主要城市1994年經(jīng)濟(jì)發(fā)展6個(gè)指標(biāo)的數(shù)據(jù)建立的數(shù)據(jù)文件,其中x1:人均GDP(萬元/人);x1:人均GDP(萬元/人);x2:利用外資(億美元);x3:公路密度(km/km2);x4:平均受教育年限(年);x5:鄉(xiāng)鎮(zhèn)工業(yè)比例(%);x6:人均固定資產(chǎn)凈值(萬元/人)。試?yán)眠@些資料對(duì)這些城市經(jīng)濟(jì)狀況作因子分析。⑴Analyze→DataReduction→Factor。⑵從源變量表中移入若干作因子分析的變量。注:此時(shí)的分析變量(原變量)可以不標(biāo)準(zhǔn)化。第二十四頁,共五十二頁,編輯于2023年,星期五⑶若需要用某參數(shù)的某部分樣本值參與因子分析時(shí),從源變量表中選此參變量移入SelectionVariable框中,單擊右邊的Value按鈕,輸入所要選擇的那部分變量值。如果使用全部觀測量,此步省略。⑷單擊Descriptives,從中選擇需要輸出的統(tǒng)計(jì)量。①Statistics統(tǒng)計(jì)量子欄UnivariateDescriptives:單變量描述統(tǒng)計(jì)量。輸出各變量的均值、標(biāo)準(zhǔn)差及樣本數(shù)。Initialsolution:初始化解,為系統(tǒng)默認(rèn)項(xiàng)。輸出各分析變量的初始共同度、特征值及解釋方差的百分比。②CorrelationMatrix(相關(guān)矩陣)子欄Coefficients:分析變量相關(guān)系數(shù)矩陣。第二十五頁,共五十二頁,編輯于2023年,星期五Significancelevels:顯著性水平。輸出每個(gè)相關(guān)系數(shù)為0的單尾顯著性水平。Determinant:相關(guān)系數(shù)矩陣的行列式值。KMOandBartlett’testofsphericity:KMO檢驗(yàn)和Bartlett球形檢驗(yàn)。前者給出抽樣充足量的測度,檢驗(yàn)變量間的偏相關(guān)系數(shù)是否過小。后者檢驗(yàn)相關(guān)系數(shù)矩陣是否是單位矩陣,若是單位矩陣,則表明不適合采用因子模型。Inverse:相關(guān)系數(shù)矩陣的逆矩陣。Reporduced:再生相關(guān)系數(shù)矩陣。輸出因子分析后的估計(jì)相關(guān)系數(shù)矩陣及殘差(原始相關(guān)陣與再生相關(guān)系數(shù)矩陣的差)。Anti-image:反映像相關(guān)陣。包括偏相關(guān)系數(shù)的負(fù)數(shù)及偏協(xié)方差的負(fù)數(shù),在一個(gè)好的因子模型中,反映像相關(guān)陣中,主對(duì)角線之外的元素應(yīng)很小,主對(duì)角線上的元素用于測度抽樣的充足量。第二十六頁,共五十二頁,編輯于2023年,星期五⑸單擊Extraction(提?。?,從中選擇因子提取方法。①單擊Method框箭頭,展開下拉列表,從中選擇公因子提取的方法。其中有:Principalcomponents:主成分分析法,系統(tǒng)默認(rèn)。Unweightedleastsquares:不加權(quán)最小二乘法。Generalizedleastsquares:普通最小二乘法。Maximumlikelihood:極大似然法。Principalaxisfactoring:主軸因子法。Alphafactoring:α因子法。Imagefactoring:映像因子法。第二十七頁,共五十二頁,編輯于2023年,星期五②Analyze(分析)子欄,用于選擇分析內(nèi)容?!馛orrelationmatrix:相關(guān)系數(shù)矩陣。此選項(xiàng)為系統(tǒng)默認(rèn)?!馛ovariancematrix:協(xié)方差矩陣。⑹Display(顯示)子欄,用于選擇顯示內(nèi)容?!馯nrotatedfactorsolution:顯示未經(jīng)旋轉(zhuǎn)的因子解,即未經(jīng)旋轉(zhuǎn)的因子載荷矩陣、共同度以及特征值。此項(xiàng)為系統(tǒng)默認(rèn)選項(xiàng)?!馭creeplot:碎石圖,它是與各因子關(guān)聯(lián)的方差散點(diǎn)圖,用它確定有多少因子應(yīng)予以保留。圖上有一個(gè)明顯的分界點(diǎn),它的左邊陡峭的斜坡代表大因子,右邊緩變的尾部代表其余的小因子(碎石)。第二十八頁,共五十二頁,編輯于2023年,星期五⑺Extract(提取)子欄,用于選擇提取公因子的數(shù)量?!馝igenvaluesover:選擇此選項(xiàng)并在后面的矩形框中輸入一數(shù)值(系統(tǒng)的默認(rèn)值為1),凡特征值大于該數(shù)值的因子都將被作為公因子提取出來?!馧umberoffactors:選擇此選項(xiàng)在后面的矩形框中指定提取公因子的數(shù)量。⑻MaximumIterationsforConvergence:因子分析收斂的最大迭代步數(shù),系統(tǒng)默認(rèn)的最大迭代步數(shù)為25。⑼單擊Rotation按鈕,打開Rotation(旋轉(zhuǎn))對(duì)話框。從中選擇旋轉(zhuǎn)方法.①M(fèi)ethod子欄。包括:●None:不進(jìn)行旋轉(zhuǎn),是系統(tǒng)默認(rèn)的選項(xiàng)。第二十九頁,共五十二頁,編輯于2023年,星期五●Varimax:方差最大正交旋轉(zhuǎn)。這種旋轉(zhuǎn)方法使每個(gè)因子具有高載荷,以使因子的解釋得到簡化。●DirectOblimin:斜交旋轉(zhuǎn)法。選擇此項(xiàng),在被激活的Delta(δ)小框中輸入不超過0.8的數(shù)值。系統(tǒng)默認(rèn)的δ值為0,表示因子分析的解最傾斜。δ值可取負(fù)值(≥-1),δ值越接近于-1,旋轉(zhuǎn)越接近正交?!馫uartimax:四分旋轉(zhuǎn)法。是一種用最少的因子解釋每個(gè)變量的旋轉(zhuǎn)法?!馝quamax:平均正交旋轉(zhuǎn)法。它是將Varimax法和Quartimax法相結(jié)合,使高載荷因子的變量數(shù)和需解釋變量的因子數(shù)都達(dá)到最小的旋轉(zhuǎn)法?!馪romax:斜交旋轉(zhuǎn)法。它允許因子之間相關(guān),比DirectOblimin法計(jì)算得更快,更適合第三十頁,共五十二頁,編輯于2023年,星期五大量數(shù)據(jù)的情況。選擇此項(xiàng),在被激活的Kappa(K)小框中輸入控制斜交旋轉(zhuǎn)的參數(shù)值,這個(gè)參數(shù)的默認(rèn)值為4(此值最適合于分析)。②Display子欄,用于設(shè)置旋轉(zhuǎn)解的輸出?!馬otatedsolution:旋轉(zhuǎn)解。當(dāng)在Method欄中選擇了一種旋轉(zhuǎn)方法后,此選項(xiàng)才被激活。對(duì)正交旋轉(zhuǎn),輸出‘旋轉(zhuǎn)模型矩陣、因子轉(zhuǎn)換矩陣。對(duì)斜交旋轉(zhuǎn),則輸出模式、結(jié)構(gòu)和因子相關(guān)矩陣?!馤oadingplot(s):因子載荷圖。選擇此項(xiàng),輸出前兩個(gè)公因子的二維載荷圖,或前3個(gè)因子的三維載荷圖,如果僅提取一個(gè)公因子,則不輸出因子載荷圖。當(dāng)選擇了一種旋轉(zhuǎn)方法后,對(duì)話框中選項(xiàng)MaximumIterationsforConvergence(旋轉(zhuǎn)收斂的最大迭代次數(shù))被激活,允許在其后小框中指定最大迭代次數(shù),系統(tǒng)默認(rèn)值為25。第三十一頁,共五十二頁,編輯于2023年,星期五⑽單擊Scores按鈕,打開FactorsScores(因子得分)對(duì)話框?!馭aveasvariables:選擇此選項(xiàng)時(shí),對(duì)每個(gè)公共因子建立一個(gè)新變量(根據(jù)提取的公共因子的多少,默認(rèn)的變量名為fac_i,i=1,2,…),將因子得分保存到當(dāng)前工作文件中,供其他統(tǒng)計(jì)分析時(shí)使用。這時(shí)下方的Method子欄被激活,可以從中選擇計(jì)算因子得分的方法。Regression:回歸法。選擇此項(xiàng),則產(chǎn)生的因子得分的均值等于0,方差等于估計(jì)的因子得分與真實(shí)的因子值之間的復(fù)相關(guān)系數(shù)的平方。Bartlett:巴特列特法。選擇此項(xiàng),則產(chǎn)生的因子得分的均值等于0,變量范圍之外的因子第三十二頁,共五十二頁,編輯于2023年,星期五的平方和達(dá)到最小。Anderson-Rubin:安德森—魯賓法。選擇此項(xiàng),則產(chǎn)生的因子得分的均值等于0,方差等于1。此方法是對(duì)Bartlett法的改進(jìn),它保證了被估計(jì)因子的正交性。對(duì)話框中還有一個(gè)選項(xiàng):●Displayfactorscorecoefficientmatrix:顯示因子得分系數(shù)矩陣,變量乘以該矩陣中的系數(shù)可獲得因子得分,此矩陣也可以表示各因子得分之間的相關(guān)性。⑾單擊Options按鈕,打開Options對(duì)話框。

①M(fèi)inssingValues子欄,用于設(shè)置缺失值的處理方式?!馝xcludecaseslistwise:剔除分析變量中的缺失值為系統(tǒng)默認(rèn)選項(xiàng)。第三十三頁,共五十二頁,編輯于2023年,星期五●Excludecasespairwise:成對(duì)地剔除含有缺失值的觀測量?!馬eplacewithmean:用變量均值替代缺失值。②CoefficientDisplayFormat(系數(shù)顯示格式)子欄,用于控制輸出矩陣的外觀?!馭ortbysize:將因子載荷矩陣和結(jié)構(gòu)矩陣按數(shù)值大小排序,使得對(duì)同一因子具有高載荷的變量在一起顯示?!馭uppressabsolutevalueslessthan:不顯示那些絕對(duì)值小于指定數(shù)值的載荷系數(shù),系統(tǒng)默認(rèn)的指定值為0.1,也可以在小框內(nèi)輸入0~1之間的任意數(shù)值。上述各選項(xiàng)選擇完畢,返回主對(duì)話框單擊OK按鈕運(yùn)行。第三十四頁,共五十二頁,編輯于2023年,星期五7.2結(jié)果分析方法例根據(jù)江蘇省主要城市1994年經(jīng)濟(jì)發(fā)展若干指標(biāo)的數(shù)據(jù)建立的數(shù)據(jù)文件(數(shù)據(jù)取自《數(shù)理統(tǒng)計(jì)與管理》1999年第1期),其中各變量的意義為x1:人均GDP(萬元/人);x2:利用外資(億美元);x3:公路密度(km/km2);x4:平均受教育年限(年);x5:鄉(xiāng)鎮(zhèn)工業(yè)比例(%);x6:人均固定資產(chǎn)凈值(萬元/人)。試?yán)眠@些資料對(duì)這些城市經(jīng)濟(jì)發(fā)展?fàn)顩r作因子分析。本例選項(xiàng):⒈Description按鈕①Coefficients(相關(guān)系數(shù)矩陣)第三十五頁,共五十二頁,編輯于2023年,星期五②Significancelevels(顯著性水平)③Determinant(相關(guān)系數(shù)矩陣的行列式值);⒉Extraction按鈕(從中選擇因子提取方法)①Screeplot(輸出碎石圖);⒊Rotation按鈕:①Varimax(方差最大正交旋轉(zhuǎn))②Loadingplot(輸出因子載荷圖);⒋Scores按鈕①Displayfactorscorecoefficientmatrix(顯示因子得分系數(shù)矩陣)。第三十六頁,共五十二頁,編輯于2023年,星期五本例因子分析輸出結(jié)果共有8個(gè)表,2個(gè)圖:⑴相關(guān)系數(shù)矩陣及顯著性檢驗(yàn)結(jié)果表。①CorrelationMatrix(相關(guān)系數(shù)矩陣)表1表1的上半部分為各變量之間的相關(guān)系數(shù)矩陣,下半部分為各變量不相關(guān)的單尾顯著性水平,顯著性檢驗(yàn)矩陣中的空格表示0。由此表可以看出多數(shù)變量之間存在高度的相關(guān)關(guān)系,因此有必要進(jìn)行因子分析。表下注釋給出了相關(guān)系數(shù)矩陣的行列式值等于1.004E-5。②表Communalities(變量共同度)表2表2中給出了提取公共因子前后各變量的共同度,根據(jù)變量共同度的統(tǒng)計(jì)意義,它刻劃了全部公共因子對(duì)于變量xi的總方差所作的貢獻(xiàn),它說明了全部公共因子反映出原變量信息的百分比。例如,第三十七頁,共五十二頁,編輯于2023年,星期五提取公共因子后,變量x1的共同度為0.991,即提取的公共因子對(duì)變量x1的方差Var(x1)作出了99.1%的貢獻(xiàn)。從Extraction一列的數(shù)值看出,各個(gè)變量的共同度都比較大,說明變量空間轉(zhuǎn)化為因子空間時(shí),保留了比較多的信息,因此,因子分析的效果是顯著的。表下注釋指出了提取公共因子的方法是主成分分析法。③總方差分解(或總方差解釋)表3。表3為TotalVarianceExplained(總方差分解)表,表中包括:

Component:因子序號(hào)。

InitialEigenvalues:初始特征值。其中Total一列為相關(guān)系數(shù)矩陣的全部特征值;%ofVariance為各個(gè)特征值的方差貢獻(xiàn)率;Cumulative%為累積貢獻(xiàn)率,前兩個(gè)因子的累積貢獻(xiàn)率已達(dá)到88.821%。第三十八頁,共五十二頁,編輯于2023年,星期五ComponentInitialEigenvaluesExtractionSumsofSquaredLoadings(未經(jīng)旋轉(zhuǎn))RotationSumsofSquaredLoadings(旋轉(zhuǎn)后)Total%OfVarianceCumulative%(方差貢獻(xiàn)率)Total%OfVarianceCumulative%(方差貢獻(xiàn)率)Total%OfVarianceCumulative%(方差貢獻(xiàn)率)13.75862.63362.6333.75862.6362.6332.87247.87447.87421.57126.18888.8211.57126.18888.8212.45740.94788.82130.457.49796.31840.2063.42799.74550.013980.23399.97860.0013150.0219100表3TotalVarianceExplained(總方差分解)表ExtractionMethod:PrincipalComponentAnalysis(因子提取方法:主成分分析)第三十九頁,共五十二頁,編輯于2023年,星期五●ExtractionSumsofSquaredLoadings:未經(jīng)旋轉(zhuǎn)提取因子的載荷平方和。由于相關(guān)系數(shù)矩陣有兩個(gè)最大的特征值分別為3.758和1.571(據(jù)因子提取對(duì)話框的設(shè)定,提取特征值大于1的因子),提取兩個(gè)公共因子?!馬otationSurnsofSquaredLoadings:旋轉(zhuǎn)后提取因子的載荷平方和.④碎石圖,如圖1所示。碎石圖的縱坐標(biāo)為特征值(Eigenvalue),橫坐標(biāo)為因子數(shù)(ComponentNumber),從圖中可以看出前兩個(gè)因子的特征值大(皆大于1),圖中折線陡峭,從第三個(gè)因子以后,線平緩。因此,選擇兩個(gè)公共因子。第四十頁,共五十二頁,編輯于2023年,星期五圖1碎石圖⑤因子載荷矩陣如表4所示。由表4可知,提取了兩個(gè)公共因子,如設(shè)F1和F2分別為第一、第二主因子,從而得出因子模型為:x1=0.985F1+0.144F2x2=0.714F1+0.519F2第四十一頁,共五十二頁,編輯于2023年,星期五Component12X1人均GDP(萬元/人)0.9850.144X2利用外資額(億美元)0.7140.519X3公路密度(km/km20.608-0.691X4平均受教育年限(年)0.819-0.43X5鄉(xiāng)鎮(zhèn)工業(yè)比例(%)0.5260.772X6人均固定資產(chǎn)凈值(萬元)0.981-0.149ExtractionMethod:PrincipalComponentAnalysis.a(chǎn)2componentsextracted,表4ComponentMatrix(因子載荷矩陣)第四十二頁,共五十二頁,編輯于2023年,星期五x3=0.608F1-0.691F2x4=0.819F1-0.43F2x5=0.526F1+0.772F2x6=0.981F1-0.149F2

從因子載荷矩陣和建立的因子模型看到,各因子的典型代表變量(除個(gè)別變量外)并不突出,不能對(duì)因子作出很好的解釋。因此,對(duì)因子載荷矩陣施行旋轉(zhuǎn)是非常必要的。注意,SPSS作因子分析時(shí),將變量和各公共因子進(jìn)行標(biāo)準(zhǔn)化處理,即因子模型中的變量x1~X6都是均值為0,方差為1的變量(即變量的Z得分),這里仍沿用原來的變量名。而在最初輸入時(shí)的變量(原變量)可以不標(biāo)準(zhǔn)化,只是用因子模型計(jì)算時(shí)必需是標(biāo)準(zhǔn)化變量。⑥因子旋轉(zhuǎn)后的因子載荷矩陣如表5所示。第四十三頁,共五十二頁,編輯于2023年,星期五表5RotatedComponentMatrix(旋轉(zhuǎn)后的因子載荷矩陣)

Component12X1人均GDP(萬元/人)0.6680.738X2利用外資額(億美元)0.220.854X3公路密度(km/km20.909-0.146X4平均受教育年限(年)0.9060.189X5鄉(xiāng)鎮(zhèn)工業(yè)比例(%)-0.085960.93X6人均固定資產(chǎn)凈值(萬元)0.8510.509

ExtractionMethod:PrincipalComponentAnalysis.

RotationMethod:VarimaxwithKaiserNormalization.

aRotationconvergedin3iterations.第四十四頁,共五十二頁,編輯于2023年,星期五表5是對(duì)表4的因子載荷矩陣施行方差最大正交旋轉(zhuǎn)后的結(jié)果,由此不難建立旋轉(zhuǎn)后的因子模型??梢钥闯?,第一主因子主要由變量x3、x4和x6決定,它們在主因子上的載荷分別為:0.909、0.906和0.851;第二主因子則主要由變量x1、x2和x5決定,它們在主因子上的載荷分別為:0.738,0.854和0.930。表下注釋:提取公因子方法是主成分分析法;旋轉(zhuǎn)方法為方差最大正交旋轉(zhuǎn)法;旋轉(zhuǎn)經(jīng)3步迭代得到。⑦因子轉(zhuǎn)換矩陣如表6所示。表6ComponentTransformationMatrix(因子轉(zhuǎn)換矩陣)Component1210.77120.63620.6360.771第四十五頁,共五十二頁,編輯于2023年,星期五旋轉(zhuǎn)前的因子載荷矩陣乘以因子旋轉(zhuǎn)矩陣等于旋轉(zhuǎn)后的因子載荷矩陣。⑧因子載荷圖如圖2所示。由于本問題中提取了兩個(gè)公因子,所以輸出二維平面圖。從因子載荷圖上可以看到,旋轉(zhuǎn)后在主因子為坐標(biāo)軸的二維平面上原變量的位置。⑨因子得分系數(shù)矩陣如表7所示。因子模型將變量表示成公共因子的線性組合,自然也可以將公共因子表示成原始變量的線性組合。據(jù)選擇計(jì)算因子得分的回歸方法,即將公因子對(duì)變量X1~X6作線性回歸,得到系數(shù)的最小二乘估計(jì)就是所謂的因子得分系數(shù):

C=ATR-1其中矩陣A為旋轉(zhuǎn)后的因子載荷矩陣,R-1為相關(guān)系數(shù)矩陣的逆矩陣。第四十六頁,共五十二頁,編輯于2023年,星期五表7

ComponentScroreCoefficientMatrix(因子得分系數(shù)矩陣)Component12X1人均GDP(萬元/人)0.1440.238X2利用外資額(億美元)-0.0640.376X3公路密度(km/km20.405-0.236X4平均受教育年限(年)0.342-0.073X5鄉(xiāng)鎮(zhèn)工業(yè)比例(%)-0.2050.468X6人均固定資產(chǎn)凈值(萬元)0.2620.093ExtractionMethod:PrincipalComponentAnalysis.RotationMethod:VarimaxwithKaiserNormalization.ComponentScores.第四十七頁,共五十二頁,編輯于2023年,星期五根據(jù)因子得分系數(shù)和原始變量的觀測值可以計(jì)算出各個(gè)觀測量的因子得分:

F=A’R-1X或者F1=0144X1-0.064X2+0.405X3+0.342X4-0.205X5+0.262X6F1=0.238X1+0.376X2-0.236X3-0.073X4+0.468X5+0.093X6

由于在Save對(duì)話框中選擇了Saveasvariables選項(xiàng),所以在工作文件中,保存了兩個(gè)新變量

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論