地理學(xué)模型方法及應(yīng)用

上傳人：石*** IP屬地：廣東上傳時(shí)間：2023-05-26 格式：PPT 頁數(shù)：52 大小：2.24MB 積分：28 舉報(bào) 版權(quán)申訴

已閱讀5頁，還剩47頁未讀，繼續(xù)免費(fèi)閱讀

版權(quán)說明：本文檔由用戶提供并上傳，收益歸屬內(nèi)容提供方，若內(nèi)容存在侵權(quán)，請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

地理學(xué)模型方法及應(yīng)用第一頁，共五十二頁，編輯于2023年，星期五一、SPSS統(tǒng)計(jì)軟件應(yīng)用基礎(chǔ)第二頁，共五十二頁，編輯于2023年，星期五一、數(shù)據(jù)輸入1.Name變量名稱：首字必須是字母、變量名不多于8個(gè)字符。2.Type數(shù)據(jù)變量類型：Numeric標(biāo)準(zhǔn)、String字符、Date日期3.Width變量格式寬度：指數(shù)據(jù)窗口中變量列所占單元格的列寬度。不同于變量寬度。若變量寬度>變量格式寬度，在數(shù)據(jù)窗口中顯示變量名的字符數(shù)不夠，變量名將被截去尾部而不完全顯示。輸入的數(shù)據(jù)可能截去尾部，用“*”號(hào)代替。4.Decimals小數(shù)位數(shù)第三頁，共五十二頁，編輯于2023年，星期五5.Label變量標(biāo)簽：是對(duì)變量的附加說明。6.Value值標(biāo)簽：是對(duì)變量的可能取值附加的進(jìn)一步說明。如果將它定義為一個(gè)數(shù)字型變量，在值標(biāo)簽開關(guān)開啟時(shí)，要輸入部門名稱，只需要輸入它的值，就可顯示出值標(biāo)簽。7.Missing缺失值：指沒測到、沒記錄到、或結(jié)果明顯錯(cuò)誤的數(shù)據(jù)。系統(tǒng)默認(rèn)的數(shù)值型缺失值為0，字符型缺失值為空格，我們也可自定義缺失值。如把小麥畝產(chǎn)量大于1500公斤的數(shù)據(jù)記為缺失值。8.Alignment單元格對(duì)齊格式：有左中右之分。9.Measurement測度：Scale定比測度（取值于一個(gè)區(qū)間或連續(xù)變量，如身高、收入），Ordinal定序測度（無論是數(shù)字型還是字符型，只要有順序分類，如大中小、優(yōu)良中差），Nominal定類測度（若是不具有某種內(nèi)在順序分類的字符型變量，如地理區(qū)域的劃分、公司部門等，可設(shè)置為Nominal測度）。第四頁，共五十二頁，編輯于2023年，星期五二、數(shù)據(jù)標(biāo)準(zhǔn)化1.標(biāo)準(zhǔn)化公式：Zi=(xi-x均)/s其中：x均為算術(shù)平均值；s為標(biāo)準(zhǔn)差（樣本方差）S=[1/(n-1)Σ(xi-x均)2]1/22.方法Analyze→DescriptiveStatistics→Descriptives，打開Descriptives對(duì)話框，選SaveStandardizedValueVariables三、方差分析(一)單因素方差分析及其原理1.在科學(xué)研究中，需要在諸多因素中，分析哪些因素對(duì)該事物有顯著影響？影響因素如何搭配效果最佳？影響因素間是否有交互作用？方差分析就是處理這類問題的統(tǒng)計(jì)分析方法。第五頁，共五十二頁，編輯于2023年，星期五2.單因素方差分析基本原理研究因素影響是否顯著，就是檢驗(yàn)如下假設(shè)：H0：μ1=μ2=…=μr當(dāng)p<0.05（系統(tǒng)默認(rèn)的顯著性概率值）時(shí)，推翻原假設(shè)，認(rèn)為這些因素的影響是顯著的，說明這些因素造成的均值差異有統(tǒng)計(jì)意義；否則認(rèn)為影響是不顯著的。3.方法Analyze→CompareMeans→One-WayAnalysisofVariance。分別輸入因變量DependentList和因素變量Factor。Significanceleve確定顯著性水平，一般選0.1,0.05,0.01，系統(tǒng)默認(rèn)的顯著性概率為0.05。4.結(jié)果分析表中第一列為方差來源：①組間（由于因素不同水平或位級(jí)所造成的差異）；②組內(nèi)（由于偶然或不可控制的隨機(jī)因素所造成的差異）；③總平方和。表中第一行：平方和；df為自由度;均方;F為組間均方除以組內(nèi)均方的商;Sig.為F分目的顯著性概率。第六頁，共五十二頁，編輯于2023年，星期五(二)單變量多因素方差分析研究一個(gè)因變量與多個(gè)獨(dú)立自變量或因素間的關(guān)系。1.多因素方差分析基本原理研究因素影響是否顯著，就是檢驗(yàn)各因素及它們之間的交互作用對(duì)總體均值影響是否顯著，即檢驗(yàn)如下假設(shè)均方差：H0A=σ1=σ2=…=σr;H0B=β1=β2=…=βr;

H0A×B=γ1=γ2=…=γr;2.方法Analyze→GeneralLinearModel→Univariate分別輸入因變量DependentList和多個(gè)不變因素FixedFactor3.結(jié)果分析有2個(gè)表：表①為主因素變量信息表（Between-SubjectsFactors），含變量取值及頻數(shù)N。第七頁，共五十二頁，編輯于2023年，星期五表②為主效應(yīng)方差分析表（TestsofBetween-SubjectsEffects）.表中第一行分別為：Source為方差來源；TypeⅢSume為按系統(tǒng)默認(rèn)Ⅲ型草方和計(jì)算出的離差平方和；df為自由度；MeanSquare為均方，即平方和與自由度之商;F為[Σ(xi-x均)2]1/2與[Σ隨機(jī)誤差平方和]1/2之比；Sig.為接受原假設(shè)的顯著性概率。表中第一列分別為：修正模型;截距平方和（截距指線性模型中的截距）;因素1;因素2;因素1*因素2交互效應(yīng);誤差;因變量的總平方和;修正模型的總平方和。三、相關(guān)分析1.二元變量相關(guān)分析方法：Analyze→Correlate→Bivariate(二元變量)，選了Flagssignificantecorrelations項(xiàng)，顯著水平0.05以下顯著相關(guān)的相關(guān)系數(shù)用*標(biāo)記，顯著水平0.01以下顯著相關(guān)的相關(guān)系數(shù)用**標(biāo)記。Pearson皮爾遜相關(guān)系數(shù)（|Rxy|≤1）:Rxy=Σ(xi-x均)(yi-y均)/[Σ(xi-x均)2Σ(yi-y均)2]1/2第八頁，共五十二頁，編輯于2023年，星期五Kendall’stau-b為肯德爾秩相關(guān)系數(shù)。Spearman為斯皮爾曼秩相關(guān)系數(shù)。Two-tailed為雙尾假設(shè)檢驗(yàn)。One-tailed為單尾假設(shè)檢驗(yàn)。2.偏相關(guān)分析2.1偏相關(guān)系數(shù)定義指當(dāng)其他變量被固定，給定的任意兩個(gè)變量之間的相關(guān)系數(shù)。偏相關(guān)系數(shù)才是真正反映兩個(gè)變量的相關(guān)關(guān)系的統(tǒng)計(jì)量。在多元分析相關(guān)分析中，Pearson皮爾遜相關(guān)系數(shù)只是從表面上反映兩變量相關(guān)的性質(zhì)，往往不能真實(shí)反映，甚至造成相關(guān)的假象。2.2方法Analyze→Correlate→PartialCorrelations（偏相關(guān)）輸入兩個(gè)或兩個(gè)以上需要進(jìn)行相關(guān)分析的變量移入Variable框內(nèi)。再輸入至少1個(gè)控制變量移入控制變量欄?；騼蓚€(gè)以上需要進(jìn)行相關(guān)分析的變量移入Variable框內(nèi)。第九頁，共五十二頁，編輯于2023年，星期五選了Displayactualsigificance項(xiàng)，在顯示相關(guān)系數(shù)的同時(shí)，也顯示相關(guān)系數(shù)的實(shí)際顯著性概率和自由度。如果不選，顯著水平0.05以下顯著相關(guān)的相關(guān)系數(shù)用*標(biāo)記，顯著水平0.01以下顯著相關(guān)的相關(guān)系數(shù)用**標(biāo)記。四、回歸分析1.線性回歸分析1.1方法

Analyze→Regression→Linear。輸入兩個(gè)或兩個(gè)以上需要進(jìn)行相關(guān)分析的變量移入Variable框內(nèi)。再輸入至少1個(gè)控制變量移入控制變量欄。或兩個(gè)以上需要進(jìn)行相關(guān)分析的變量移入Variable框內(nèi)?；貧w模型中自變量進(jìn)入方式選擇：Enter為自變量全部進(jìn)入；Stepwise為逐步回歸；Remove為移除法，根據(jù)設(shè)定的條件剔除部分自變量；Backward向后剔除法，先將所有變量引入方程，再據(jù)F值逐一剔除；Forward第十頁，共五十二頁，編輯于2023年，星期五向前剔除法，先將按偏相關(guān)系數(shù)最大的入，再引入次大的，直至將所有符合條件的變量全部引入方程為止。選項(xiàng)按鈕中Statistic中Cofidenceintervals為回歸系數(shù)B的95%置信區(qū)間。打開Plots按鈕，選Produceallpartialplots繪制出散點(diǎn)圖。打開Save按鈕，選PredicatedValues中的非標(biāo)準(zhǔn)化或標(biāo)準(zhǔn)化的預(yù)測值。選Residuals保存殘差。1.2結(jié)果分析(回歸方程的建立)2.非線性回歸分析Analyze→Regression→noLinear第十一頁，共五十二頁，編輯于2023年，星期五3.曲線估計(jì)3.1方法Analyze→Regression→CureEstimation3.2線型模型的選擇方法線性模型，二次，復(fù)合y=a(b)t，生長曲線y=exp(a+bt)，對(duì)數(shù)曲線y=a+blnt，三次曲線，S曲線y=exp(a+b/t)，指數(shù)曲線y=aexp(bt)，逆曲線y=a+b/t，冪指曲線y=a(t)b，邏輯曲線y=[1/u+a(b)t]，選邏輯曲線時(shí)，必須在被激活的Upperbound框中輸入u>0,且必須大于因變量的最大值，稱u為上界。五、非參數(shù)檢驗(yàn)5.1單個(gè)樣本K-S檢驗(yàn)：可檢驗(yàn)一個(gè)樣本是否服從正態(tài)、泊松、均勻和指數(shù)分布。5.1.1方法Analyze→NonparametricTests→1-SampleK-S打開One-sampleKolmogorov-SmirnovTest對(duì)話框。第十二頁，共五十二頁，編輯于2023年，星期五5.1.2檢驗(yàn)概率分布選擇方法Normal:正態(tài)分布;Poisson:泊松分布;Uniform:均勻分布;Exponetial:指數(shù)分布。5.1.3結(jié)果分析方法N：樣本總數(shù);Normalparameter(正態(tài)分布參數(shù))：均值,標(biāo)準(zhǔn)差;MostExtremeDifferences（最大的）：絕對(duì)值，最大正極端差,最大負(fù)極端;Kolmogorov-SmirnovZ:K-S檢驗(yàn)統(tǒng)計(jì)量Z值;Asymp.Sig.(2-tailed)：雙尾漸進(jìn)顯著性概率（大于0.05接受原假設(shè)，即μ＝μ0，服從正態(tài)分布）。5.2多個(gè)獨(dú)立樣本檢驗(yàn)：可檢驗(yàn)多個(gè)獨(dú)立樣本是否來自具有相同分布總體的樣本。（若多個(gè)樣本來自等方差的正態(tài)總體時(shí)，才能用方差分析檢驗(yàn)）5.2.1方法Analyze→NonparametricTests→KIndependentSample第十三頁，共五十二頁，編輯于2023年，星期五5.2.2檢驗(yàn)方法選擇有兩種方法可選①克魯凱-沃里斯H檢驗(yàn)；中位數(shù)檢驗(yàn)Median。5.2.3結(jié)果分析方法例1從某車間使用的4種不同操作方法下生產(chǎn)的產(chǎn)品中，分別抽查若干批進(jìn)行檢驗(yàn)，測得被抽查的各批產(chǎn)品的優(yōu)等品率（%）的數(shù)據(jù)資料見表.試檢驗(yàn)不同操作方法對(duì)產(chǎn)品優(yōu)等品率有無顯著影響。H檢驗(yàn)有2個(gè)表：表1為平均秩（Ranks）表；表2為H檢驗(yàn)結(jié)果表：①卡方統(tǒng)計(jì)量值為11.53，自由度df為3；②漸進(jìn)顯著性概率Sig.為0.009<0.05。因此認(rèn)為這4種不同操作方法對(duì)產(chǎn)品優(yōu)等品率有顯著影響（拒絕原假設(shè)：4種樣本屬同分布）。第十四頁，共五十二頁，編輯于2023年，星期五六、聚類分析與判別分析分類問題可分為兩種：

一種是事先不知道應(yīng)將樣品（Q-型聚類）、或指標(biāo)（R-型聚類）分為幾類，需要根據(jù)樣品或變量的相似程度，歸組并類，這種分類問題用聚類分析法（ClusterAnalysis）解決；

第二種是事先已經(jīng)建立了分類，然后將新樣品按照已知類別進(jìn)行歸類，解決這種分類問題用判別分析法（DiscriminantAnalysis）

。㈠聚類分析聚類分析分為動(dòng)態(tài)聚類分析法、系統(tǒng)聚類分析法等。

動(dòng)態(tài)聚類法也稱為快速聚類法，或K-均值聚類法（K-MeansCluster），快速聚類的思想是：開始按照一定方法選取一批聚類中心（ClusterCenter），讓樣品向最近的聚心凝聚，形成初始分類，然后按最近距離原則不斷修改不合理分類，直至合理為止。第十五頁，共五十二頁，編輯于2023年，星期五

系統(tǒng)聚類分析法也稱為分層聚類法（HierarchicalCluster），分層聚類的思想是：開始將樣品或指標(biāo)各視為一類，根據(jù)類與類之間的距離或相似程度將最相似的類加以合并，再計(jì)算新類與其它類之間的相似程度，并選擇最相似的類加以合并，這樣每合并一次就減少一類，不斷繼續(xù)這一過程，直到所有樣品或指標(biāo)合并為一類為止。1.快速聚類分析（K-均值聚類法）⑴方法(以10湖泊水質(zhì)評(píng)價(jià)為例)例2將聚類分析法用于湖泊富營養(yǎng)化評(píng)價(jià)。有10個(gè)湖泊樣本，其透明度（SD）、總氮（TN）、總磷（TP）和化學(xué)需氧量（COD）等參數(shù)的標(biāo)準(zhǔn)化值如表所示。①Analyze→Classify→K-MeansCluster②從源變量欄選擇一個(gè)或幾個(gè)分析變量（數(shù)字型：numeric）移入Variables框中；選擇一個(gè)字符型（String）標(biāo)記變量(lake)移入LabelCaseby框中。③在NumberofCludter小框指定聚類數(shù)（系統(tǒng)默認(rèn)聚類數(shù)為2）3。第十六頁，共五十二頁，編輯于2023年，星期五④從Method欄中選擇一種聚類方法：Iterateandclassify:系統(tǒng)默認(rèn)選項(xiàng)，表示在迭代過程中不斷地更新聚類中心；Classifyonly:用初始聚類中心對(duì)觀測量進(jìn)行聚類，聚類中心始終不變。⑤單擊Iterate（迭代）：在MaximumIterations右邊的文本框中，輸入一個(gè)整數(shù)限定迭代步數(shù)，系統(tǒng)默認(rèn)值為10。在ConvergenceCriterion右邊的文本框中，輸入一個(gè)不超過1的正數(shù)作為判定迭代收斂的標(biāo)準(zhǔn)。缺省的收斂標(biāo)準(zhǔn)值為0.02，表示當(dāng)兩次迭代計(jì)算的聚心之間距離的最大改變量小于初始聚心間最小距離的2%時(shí)終止迭代。⑥單擊Save：Clustermembership：在工作文件中建立一個(gè)名為“gcl_1”的新變量，其值為觀測量的類別。第十七頁，共五十二頁，編輯于2023年，星期五Distancefrimclustercenter:在工作文件中建立一個(gè)名為“gcl_2”的新變量，其值為各觀測量與所屬類聚心之間的歐氏距離。⑦打開Options：彈出對(duì)話框中Statistcs指定輸出統(tǒng)計(jì)量值，包括：Initialclustercenters：系統(tǒng)默認(rèn)選項(xiàng)，表示輸出初始類聚心表。ANOVAtable:輸出方差分析表。Clusterinformationforeachcase：顯示每個(gè)觀測量的聚類信息。包括各觀測量最終被聚入的類別、各觀測量與最終聚心之間的歐氏距離，以及最終聚心之間的歐氏距離。⑵結(jié)果分析①初始類聚心表Initialclustercenters②迭代史表IterationHistory：給出迭代過程中各聚心演變。表下注釋指出聚類過程經(jīng)2次就終止了。初始聚類中心之間最小距離為0.533。第十八頁，共五十二頁，編輯于2023年，星期五③樣品隸屬表Clustermembership：給出聚類后樣品所隸屬類型。Cluster列為隸屬類別，Distance列為觀測量與聚心之距離。④最終聚類中心表：給出最終的類中心之間距離。⑤每類中樣品數(shù)NumberofcaseineachCluster。2.分層聚類分析（系統(tǒng)聚類分析法）Analyze→Classify→HierarchicalCluster①從源變量欄選擇一個(gè)或幾個(gè)分析變量（數(shù)字型：numeric）移入Variables框中；選擇一個(gè)字符型（String）標(biāo)記變量(lake)移入LabelCaseby框中。②在Cluster欄中選擇聚類類型：Cases：計(jì)算觀測量之間的距離，進(jìn)行觀測量聚類。Variables：計(jì)算變量之間的距離，進(jìn)行變量聚類。③在Display欄中選擇顯示內(nèi)容，其中兩項(xiàng)皆為系統(tǒng)默認(rèn)選項(xiàng)：第十九頁，共五十二頁，編輯于2023年，星期五Statistics：顯示統(tǒng)計(jì)量，不選此項(xiàng)，對(duì)話框下

Statistics按鈕將被關(guān)閉。Plots：顯示圖形，不選此項(xiàng)，對(duì)話框下Plots按鈕將被關(guān)閉。④單擊Statistics按鈕：在Cludtermembership（樣品隸屬類型）欄中包括3個(gè)選項(xiàng)：None：不輸出樣品隸屬類表，為系統(tǒng)默認(rèn)選項(xiàng)。Singlesolution：選擇此項(xiàng)并在右邊的Cludters文本框中指定輸出分類個(gè)數(shù)n（大于1的整數(shù)），則將輸出各樣品或變量隸屬n類的隸屬表。Rangeof

solutions：選擇此項(xiàng)并在下邊的From_though_clusters的兩個(gè)小框中輸入兩個(gè)數(shù)m和n（2≤m<n），則將輸出各樣品或變量的分類數(shù)從m到n的所有（m-n類）分類的隸屬表。第二十頁，共五十二頁，編輯于2023年，星期五⑤單擊Plot按鈕：Dendrogram：龍骨圖，選擇此項(xiàng)輸出反映聚類結(jié)果的龍骨圖。在Icile（冰柱圖）欄中有3個(gè)選項(xiàng)：Allclusters：顯示全部聚類結(jié)果的冰柱圖。Specifiedrangeclusters：限制聚類解范圍，在下面的Start(開始)、Stop（終止）、By（步長）的3個(gè)小框中分別輸入3個(gè)正整數(shù)值m、n、k（m≤n，k≤n），表示從最小聚類解m開始，以增加量k為步長，到最大聚類解n為止。None:不輸出冰柱圖。⑥單擊Method按鈕，打開聚類方法選擇對(duì)話框。⑦單擊Save按鈕打開保存新變量對(duì)話框，其中ClusterMemembership欄中三個(gè)選項(xiàng)與統(tǒng)計(jì)量對(duì)話框中的相應(yīng)選項(xiàng)意義相同：None：不保存樣品隸屬類表，為系統(tǒng)默認(rèn)選項(xiàng)。第二十一頁，共五十二頁，編輯于2023年，星期五Singlesolution：選擇此項(xiàng)并在右邊的Cludters文本框中指定保存分類個(gè)數(shù)n（大于1的整數(shù)），則將保存各樣品或變量隸屬n類的隸屬表。Rangeof

solutions：選擇此項(xiàng)并在下邊的From_though_clusters的兩個(gè)小框中保存兩個(gè)數(shù)m和n（2≤m<n），則將保存各樣品或變量的分類數(shù)從m到n的所有（m-n類）分類的隸屬表。第二十二頁，共五十二頁，編輯于2023年，星期五㈡判別分析概念：事先已建立了分類，將新樣品歸為已知類別。方法：Analyze→Classify→Discriminant第二十三頁，共五十二頁，編輯于2023年，星期五七、因子分析概念：觀測數(shù)據(jù)指標(biāo)太多，且眾多變量間可能存在著相關(guān)性，實(shí)測數(shù)據(jù)包含的信息可能是重復(fù)的。因子分析法就是在盡可能不損失或少損失信息的情況下，將多個(gè)變量減少為少數(shù)幾個(gè)潛在因子（datareduction降維）。7.1方法：例3根據(jù)江蘇省主要城市1994年經(jīng)濟(jì)發(fā)展6個(gè)指標(biāo)的數(shù)據(jù)建立的數(shù)據(jù)文件，其中x1:人均GDP（萬元/人）;x1:人均GDP（萬元/人）;x2:利用外資（億美元）;x3:公路密度（km/km2）;x4:平均受教育年限（年）;x5:鄉(xiāng)鎮(zhèn)工業(yè)比例（%）;x6:人均固定資產(chǎn)凈值（萬元/人）。試?yán)眠@些資料對(duì)這些城市經(jīng)濟(jì)狀況作因子分析。⑴Analyze→DataReduction→Factor。⑵從源變量表中移入若干作因子分析的變量。注：此時(shí)的分析變量（原變量）可以不標(biāo)準(zhǔn)化。第二十四頁，共五十二頁，編輯于2023年，星期五⑶若需要用某參數(shù)的某部分樣本值參與因子分析時(shí)，從源變量表中選此參變量移入SelectionVariable框中，單擊右邊的Value按鈕，輸入所要選擇的那部分變量值。如果使用全部觀測量，此步省略。⑷單擊Descriptives，從中選擇需要輸出的統(tǒng)計(jì)量。①Statistics統(tǒng)計(jì)量子欄UnivariateDescriptives：單變量描述統(tǒng)計(jì)量。輸出各變量的均值、標(biāo)準(zhǔn)差及樣本數(shù)。Initialsolution：初始化解，為系統(tǒng)默認(rèn)項(xiàng)。輸出各分析變量的初始共同度、特征值及解釋方差的百分比。②CorrelationMatrix（相關(guān)矩陣）子欄Coefficients：分析變量相關(guān)系數(shù)矩陣。第二十五頁，共五十二頁，編輯于2023年，星期五Significancelevels：顯著性水平。輸出每個(gè)相關(guān)系數(shù)為0的單尾顯著性水平。Determinant：相關(guān)系數(shù)矩陣的行列式值。KMOandBartlett’testofsphericity:KMO檢驗(yàn)和Bartlett球形檢驗(yàn)。前者給出抽樣充足量的測度，檢驗(yàn)變量間的偏相關(guān)系數(shù)是否過小。后者檢驗(yàn)相關(guān)系數(shù)矩陣是否是單位矩陣，若是單位矩陣，則表明不適合采用因子模型。Inverse：相關(guān)系數(shù)矩陣的逆矩陣。Reporduced：再生相關(guān)系數(shù)矩陣。輸出因子分析后的估計(jì)相關(guān)系數(shù)矩陣及殘差（原始相關(guān)陣與再生相關(guān)系數(shù)矩陣的差）。Anti-image：反映像相關(guān)陣。包括偏相關(guān)系數(shù)的負(fù)數(shù)及偏協(xié)方差的負(fù)數(shù)，在一個(gè)好的因子模型中，反映像相關(guān)陣中，主對(duì)角線之外的元素應(yīng)很小，主對(duì)角線上的元素用于測度抽樣的充足量。第二十六頁，共五十二頁，編輯于2023年，星期五⑸單擊Extraction（提?。?，從中選擇因子提取方法。①單擊Method框箭頭，展開下拉列表，從中選擇公因子提取的方法。其中有：Principalcomponents：主成分分析法，系統(tǒng)默認(rèn)。Unweightedleastsquares：不加權(quán)最小二乘法。Generalizedleastsquares：普通最小二乘法。Maximumlikelihood：極大似然法。Principalaxisfactoring：主軸因子法。Alphafactoring：α因子法。Imagefactoring：映像因子法。第二十七頁，共五十二頁，編輯于2023年，星期五②Analyze(分析)子欄，用于選擇分析內(nèi)容?！馛orrelationmatrix：相關(guān)系數(shù)矩陣。此選項(xiàng)為系統(tǒng)默認(rèn)?！馛ovariancematrix：協(xié)方差矩陣。⑹Display(顯示)子欄，用于選擇顯示內(nèi)容?！馯nrotatedfactorsolution：顯示未經(jīng)旋轉(zhuǎn)的因子解，即未經(jīng)旋轉(zhuǎn)的因子載荷矩陣、共同度以及特征值。此項(xiàng)為系統(tǒng)默認(rèn)選項(xiàng)?！馭creeplot：碎石圖，它是與各因子關(guān)聯(lián)的方差散點(diǎn)圖，用它確定有多少因子應(yīng)予以保留。圖上有一個(gè)明顯的分界點(diǎn)，它的左邊陡峭的斜坡代表大因子，右邊緩變的尾部代表其余的小因子(碎石)。第二十八頁，共五十二頁，編輯于2023年，星期五⑺Extract(提取)子欄，用于選擇提取公因子的數(shù)量?！馝igenvaluesover：選擇此選項(xiàng)并在后面的矩形框中輸入一數(shù)值(系統(tǒng)的默認(rèn)值為1)，凡特征值大于該數(shù)值的因子都將被作為公因子提取出來?！馧umberoffactors：選擇此選項(xiàng)在后面的矩形框中指定提取公因子的數(shù)量。⑻MaximumIterationsforConvergence：因子分析收斂的最大迭代步數(shù)，系統(tǒng)默認(rèn)的最大迭代步數(shù)為25。⑼單擊Rotation按鈕，打開Rotation(旋轉(zhuǎn))對(duì)話框。從中選擇旋轉(zhuǎn)方法.①M(fèi)ethod子欄。包括：●None：不進(jìn)行旋轉(zhuǎn)，是系統(tǒng)默認(rèn)的選項(xiàng)。第二十九頁，共五十二頁，編輯于2023年，星期五●Varimax：方差最大正交旋轉(zhuǎn)。這種旋轉(zhuǎn)方法使每個(gè)因子具有高載荷，以使因子的解釋得到簡化。●DirectOblimin：斜交旋轉(zhuǎn)法。選擇此項(xiàng)，在被激活的Delta(δ)小框中輸入不超過0．8的數(shù)值。系統(tǒng)默認(rèn)的δ值為0，表示因子分析的解最傾斜。δ值可取負(fù)值(≥-1)，δ值越接近于-1，旋轉(zhuǎn)越接近正交?！馫uartimax：四分旋轉(zhuǎn)法。是一種用最少的因子解釋每個(gè)變量的旋轉(zhuǎn)法?！馝quamax：平均正交旋轉(zhuǎn)法。它是將Varimax法和Quartimax法相結(jié)合，使高載荷因子的變量數(shù)和需解釋變量的因子數(shù)都達(dá)到最小的旋轉(zhuǎn)法?！馪romax：斜交旋轉(zhuǎn)法。它允許因子之間相關(guān)，比DirectOblimin法計(jì)算得更快，更適合第三十頁，共五十二頁，編輯于2023年，星期五大量數(shù)據(jù)的情況。選擇此項(xiàng)，在被激活的Kappa(K)小框中輸入控制斜交旋轉(zhuǎn)的參數(shù)值，這個(gè)參數(shù)的默認(rèn)值為4(此值最適合于分析)。②Display子欄，用于設(shè)置旋轉(zhuǎn)解的輸出?！馬otatedsolution：旋轉(zhuǎn)解。當(dāng)在Method欄中選擇了一種旋轉(zhuǎn)方法后，此選項(xiàng)才被激活。對(duì)正交旋轉(zhuǎn)，輸出‘旋轉(zhuǎn)模型矩陣、因子轉(zhuǎn)換矩陣。對(duì)斜交旋轉(zhuǎn)，則輸出模式、結(jié)構(gòu)和因子相關(guān)矩陣?！馤oadingplot(s)：因子載荷圖。選擇此項(xiàng)，輸出前兩個(gè)公因子的二維載荷圖，或前3個(gè)因子的三維載荷圖，如果僅提取一個(gè)公因子，則不輸出因子載荷圖。當(dāng)選擇了一種旋轉(zhuǎn)方法后，對(duì)話框中選項(xiàng)MaximumIterationsforConvergence(旋轉(zhuǎn)收斂的最大迭代次數(shù))被激活，允許在其后小框中指定最大迭代次數(shù)，系統(tǒng)默認(rèn)值為25。第三十一頁，共五十二頁，編輯于2023年，星期五⑽單擊Scores按鈕，打開FactorsScores(因子得分)對(duì)話框?！馭aveasvariables：選擇此選項(xiàng)時(shí)，對(duì)每個(gè)公共因子建立一個(gè)新變量(根據(jù)提取的公共因子的多少，默認(rèn)的變量名為fac_i，i=1，2，…)，將因子得分保存到當(dāng)前工作文件中，供其他統(tǒng)計(jì)分析時(shí)使用。這時(shí)下方的Method子欄被激活，可以從中選擇計(jì)算因子得分的方法。Regression：回歸法。選擇此項(xiàng)，則產(chǎn)生的因子得分的均值等于0，方差等于估計(jì)的因子得分與真實(shí)的因子值之間的復(fù)相關(guān)系數(shù)的平方。Bartlett：巴特列特法。選擇此項(xiàng)，則產(chǎn)生的因子得分的均值等于0，變量范圍之外的因子第三十二頁，共五十二頁，編輯于2023年，星期五的平方和達(dá)到最小。Anderson-Rubin：安德森—魯賓法。選擇此項(xiàng)，則產(chǎn)生的因子得分的均值等于0，方差等于1。此方法是對(duì)Bartlett法的改進(jìn)，它保證了被估計(jì)因子的正交性。對(duì)話框中還有一個(gè)選項(xiàng)：●Displayfactorscorecoefficientmatrix：顯示因子得分系數(shù)矩陣，變量乘以該矩陣中的系數(shù)可獲得因子得分，此矩陣也可以表示各因子得分之間的相關(guān)性。⑾單擊Options按鈕，打開Options對(duì)話框。

①M(fèi)inssingValues子欄，用于設(shè)置缺失值的處理方式?！馝xcludecaseslistwise：剔除分析變量中的缺失值為系統(tǒng)默認(rèn)選項(xiàng)。第三十三頁，共五十二頁，編輯于2023年，星期五●Excludecasespairwise：成對(duì)地剔除含有缺失值的觀測量?！馬eplacewithmean：用變量均值替代缺失值。②CoefficientDisplayFormat(系數(shù)顯示格式)子欄，用于控制輸出矩陣的外觀?！馭ortbysize：將因子載荷矩陣和結(jié)構(gòu)矩陣按數(shù)值大小排序，使得對(duì)同一因子具有高載荷的變量在一起顯示?！馭uppressabsolutevalueslessthan：不顯示那些絕對(duì)值小于指定數(shù)值的載荷系數(shù)，系統(tǒng)默認(rèn)的指定值為0.1，也可以在小框內(nèi)輸入0～1之間的任意數(shù)值。上述各選項(xiàng)選擇完畢，返回主對(duì)話框單擊OK按鈕運(yùn)行。第三十四頁，共五十二頁，編輯于2023年，星期五7.2結(jié)果分析方法例根據(jù)江蘇省主要城市1994年經(jīng)濟(jì)發(fā)展若干指標(biāo)的數(shù)據(jù)建立的數(shù)據(jù)文件(數(shù)據(jù)取自《數(shù)理統(tǒng)計(jì)與管理》1999年第1期)，其中各變量的意義為x1：人均GDP(萬元/人)；x2：利用外資(億美元)；x3：公路密度（km/km2）；x4：平均受教育年限(年)；x5：鄉(xiāng)鎮(zhèn)工業(yè)比例(％)；x6：人均固定資產(chǎn)凈值(萬元/人)。試?yán)眠@些資料對(duì)這些城市經(jīng)濟(jì)發(fā)展?fàn)顩r作因子分析。本例選項(xiàng)：⒈Description按鈕①Coefficients（相關(guān)系數(shù)矩陣）第三十五頁，共五十二頁，編輯于2023年，星期五②Significancelevels(顯著性水平)③Determinant(相關(guān)系數(shù)矩陣的行列式值)；⒉Extraction按鈕（從中選擇因子提取方法)①Screeplot(輸出碎石圖)；⒊Rotation按鈕：①Varimax(方差最大正交旋轉(zhuǎn))②Loadingplot(輸出因子載荷圖)；⒋Scores按鈕①Displayfactorscorecoefficientmatrix(顯示因子得分系數(shù)矩陣)。第三十六頁，共五十二頁，編輯于2023年，星期五本例因子分析輸出結(jié)果共有8個(gè)表，2個(gè)圖：⑴相關(guān)系數(shù)矩陣及顯著性檢驗(yàn)結(jié)果表。①CorrelationMatrix(相關(guān)系數(shù)矩陣)表1表1的上半部分為各變量之間的相關(guān)系數(shù)矩陣，下半部分為各變量不相關(guān)的單尾顯著性水平，顯著性檢驗(yàn)矩陣中的空格表示0。由此表可以看出多數(shù)變量之間存在高度的相關(guān)關(guān)系，因此有必要進(jìn)行因子分析。表下注釋給出了相關(guān)系數(shù)矩陣的行列式值等于1.004E-5。②表Communalities(變量共同度)表2表2中給出了提取公共因子前后各變量的共同度，根據(jù)變量共同度的統(tǒng)計(jì)意義，它刻劃了全部公共因子對(duì)于變量xi的總方差所作的貢獻(xiàn)，它說明了全部公共因子反映出原變量信息的百分比。例如，第三十七頁，共五十二頁，編輯于2023年，星期五提取公共因子后，變量x1的共同度為0.991，即提取的公共因子對(duì)變量x1的方差Var(x1)作出了99.1％的貢獻(xiàn)。從Extraction一列的數(shù)值看出，各個(gè)變量的共同度都比較大，說明變量空間轉(zhuǎn)化為因子空間時(shí)，保留了比較多的信息，因此，因子分析的效果是顯著的。表下注釋指出了提取公共因子的方法是主成分分析法。③總方差分解(或總方差解釋)表3。表3為TotalVarianceExplained(總方差分解)表,表中包括：

Component：因子序號(hào)。

InitialEigenvalues：初始特征值。其中Total一列為相關(guān)系數(shù)矩陣的全部特征值；％ofVariance為各個(gè)特征值的方差貢獻(xiàn)率；Cumulative％為累積貢獻(xiàn)率，前兩個(gè)因子的累積貢獻(xiàn)率已達(dá)到88.821％。第三十八頁，共五十二頁，編輯于2023年，星期五ComponentInitialEigenvaluesExtractionSumsofSquaredLoadings（未經(jīng)旋轉(zhuǎn)）RotationSumsofSquaredLoadings（旋轉(zhuǎn)后）Total%OfVarianceCumulative%（方差貢獻(xiàn)率）Total%OfVarianceCumulative%（方差貢獻(xiàn)率）Total%OfVarianceCumulative%（方差貢獻(xiàn)率）13.75862.63362.6333.75862.6362.6332.87247.87447.87421.57126.18888.8211.57126.18888.8212.45740.94788.82130.457.49796.31840.2063.42799.74550.013980.23399.97860.0013150.0219100表3TotalVarianceExplained(總方差分解)表ExtractionMethod:PrincipalComponentAnalysis（因子提取方法：主成分分析）第三十九頁，共五十二頁，編輯于2023年，星期五●ExtractionSumsofSquaredLoadings：未經(jīng)旋轉(zhuǎn)提取因子的載荷平方和。由于相關(guān)系數(shù)矩陣有兩個(gè)最大的特征值分別為3.758和1.571(據(jù)因子提取對(duì)話框的設(shè)定，提取特征值大于1的因子)，提取兩個(gè)公共因子?！馬otationSurnsofSquaredLoadings：旋轉(zhuǎn)后提取因子的載荷平方和.④碎石圖，如圖1所示。碎石圖的縱坐標(biāo)為特征值(Eigenvalue)，橫坐標(biāo)為因子數(shù)(ComponentNumber)，從圖中可以看出前兩個(gè)因子的特征值大(皆大于1)，圖中折線陡峭，從第三個(gè)因子以后，線平緩。因此，選擇兩個(gè)公共因子。第四十頁，共五十二頁，編輯于2023年，星期五圖1碎石圖⑤因子載荷矩陣如表4所示。由表4可知，提取了兩個(gè)公共因子，如設(shè)F1和F2分別為第一、第二主因子，從而得出因子模型為：x1=0.985F1+0.144F2x2=0.714F1+0.519F2第四十一頁，共五十二頁，編輯于2023年，星期五Component12X1人均GDP(萬元／人)0.9850.144X2利用外資額(億美元)0.7140.519X3公路密度(km／km20.608-0.691X4平均受教育年限(年)0.819-0.43X5鄉(xiāng)鎮(zhèn)工業(yè)比例(％)0.5260.772X6人均固定資產(chǎn)凈值(萬元)0.981-0.149ExtractionMethod：PrincipalComponentAnalysis．a(chǎn)2componentsextracted，表4ComponentMatrix(因子載荷矩陣)第四十二頁，共五十二頁，編輯于2023年，星期五x3=0.608F1-0.691F2x4=0.819F1-0.43F2x5=0.526F1+0.772F2x6=0.981F1-0.149F2

從因子載荷矩陣和建立的因子模型看到，各因子的典型代表變量(除個(gè)別變量外)并不突出，不能對(duì)因子作出很好的解釋。因此，對(duì)因子載荷矩陣施行旋轉(zhuǎn)是非常必要的。注意，SPSS作因子分析時(shí)，將變量和各公共因子進(jìn)行標(biāo)準(zhǔn)化處理，即因子模型中的變量x1～X6都是均值為0，方差為1的變量(即變量的Z得分)，這里仍沿用原來的變量名。而在最初輸入時(shí)的變量（原變量）可以不標(biāo)準(zhǔn)化，只是用因子模型計(jì)算時(shí)必需是標(biāo)準(zhǔn)化變量。⑥因子旋轉(zhuǎn)后的因子載荷矩陣如表5所示。第四十三頁，共五十二頁，編輯于2023年，星期五表5RotatedComponentMatrix(旋轉(zhuǎn)后的因子載荷矩陣)

Component12X1人均GDP(萬元／人)0.6680.738X2利用外資額(億美元)0.220.854X3公路密度(km／km20.909-0.146X4平均受教育年限(年)0.9060.189X5鄉(xiāng)鎮(zhèn)工業(yè)比例(％)-0.085960.93X6人均固定資產(chǎn)凈值(萬元)0.8510.509

ExtractionMethod：PrincipalComponentAnalysis．

RotationMethod：VarimaxwithKaiserNormalization．

aRotationconvergedin3iterations．第四十四頁，共五十二頁，編輯于2023年，星期五表5是對(duì)表4的因子載荷矩陣施行方差最大正交旋轉(zhuǎn)后的結(jié)果，由此不難建立旋轉(zhuǎn)后的因子模型?？梢钥闯?，第一主因子主要由變量x3、x4和x6決定，它們在主因子上的載荷分別為：0.909、0.906和0.851；第二主因子則主要由變量x1、x2和x5決定，它們在主因子上的載荷分別為：0.738，0.854和0.930。表下注釋：提取公因子方法是主成分分析法；旋轉(zhuǎn)方法為方差最大正交旋轉(zhuǎn)法;旋轉(zhuǎn)經(jīng)3步迭代得到。⑦因子轉(zhuǎn)換矩陣如表6所示。表6ComponentTransformationMatrix(因子轉(zhuǎn)換矩陣)Component1210.77120.63620.6360.771第四十五頁，共五十二頁，編輯于2023年，星期五旋轉(zhuǎn)前的因子載荷矩陣乘以因子旋轉(zhuǎn)矩陣等于旋轉(zhuǎn)后的因子載荷矩陣。⑧因子載荷圖如圖2所示。由于本問題中提取了兩個(gè)公因子，所以輸出二維平面圖。從因子載荷圖上可以看到，旋轉(zhuǎn)后在主因子為坐標(biāo)軸的二維平面上原變量的位置。⑨因子得分系數(shù)矩陣如表7所示。因子模型將變量表示成公共因子的線性組合，自然也可以將公共因子表示成原始變量的線性組合。據(jù)選擇計(jì)算因子得分的回歸方法，即將公因子對(duì)變量X1～X6作線性回歸，得到系數(shù)的最小二乘估計(jì)就是所謂的因子得分系數(shù)：

C=ATR-1其中矩陣A為旋轉(zhuǎn)后的因子載荷矩陣，R-1為相關(guān)系數(shù)矩陣的逆矩陣。第四十六頁，共五十二頁，編輯于2023年，星期五表7

ComponentScroreCoefficientMatrix(因子得分系數(shù)矩陣)Component12X1人均GDP(萬元／人)0.1440.238X2利用外資額(億美元)-0.0640.376X3公路密度(km／km20.405-0.236X4平均受教育年限(年)0.342-0.073X5鄉(xiāng)鎮(zhèn)工業(yè)比例(％)-0.2050.468X6人均固定資產(chǎn)凈值(萬元)0.2620.093ExtractionMethod：PrincipalComponentAnalysis．RotationMethod：VarimaxwithKaiserNormalization．ComponentScores．第四十七頁，共五十二頁，編輯于2023年，星期五根據(jù)因子得分系數(shù)和原始變量的觀測值可以計(jì)算出各個(gè)觀測量的因子得分：

F=A’R-1X或者F1=0144X1-0.064X2+0.405X3+0.342X4-0.205X5+0.262X6F1=0.238X1+0.376X2-0.236X3-0.073X4+0.468X5+0.093X6

由于在Save對(duì)話框中選擇了Saveasvariables選項(xiàng)，所以在工作文件中，保存了兩個(gè)新變量

人人文庫> 全部分類> 教育資料 > 課件下載

溫馨提示

1. 本站所有資源如無特殊說明，都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
2. 本站的文檔不包含任何第三方提供的附件圖紙等，如果需要附件，請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
3. 本站RAR壓縮包中若帶圖紙，網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽，若沒有圖紙預(yù)覽就沒有圖紙。
4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間，僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理，對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯，并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容，請與我們聯(lián)系，我們立即糾正。
7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

地理學(xué)模型方法及應(yīng)用

文檔簡介

溫馨提示

最新文檔

評(píng)論

地理學(xué)模型方法及應(yīng)用

文檔簡介

溫馨提示

最新文檔

評(píng)論

相關(guān)文檔