應(yīng)用統(tǒng)計(jì)學(xué)實(shí)驗(yàn)報(bào)告(spss軟件)

上傳人：1*** IP屬地：湖北上傳時(shí)間：2023-09-21 格式：DOC 頁(yè)數(shù)：14 大小：1.35MB 積分：6 舉報(bào) 版權(quán)申訴

應(yīng)用統(tǒng)計(jì)學(xué)實(shí)驗(yàn)報(bào)告(spss軟件)_第2頁(yè)

應(yīng)用統(tǒng)計(jì)學(xué)實(shí)驗(yàn)報(bào)告(spss軟件)_第3頁(yè)

應(yīng)用統(tǒng)計(jì)學(xué)實(shí)驗(yàn)報(bào)告(spss軟件)_第4頁(yè)

應(yīng)用統(tǒng)計(jì)學(xué)實(shí)驗(yàn)報(bào)告(spss軟件)_第5頁(yè)

已閱讀5頁(yè)，還剩9頁(yè)未讀，繼續(xù)免費(fèi)閱讀

版權(quán)說(shuō)明：本文檔由用戶提供并上傳，收益歸屬內(nèi)容提供方，若內(nèi)容存在侵權(quán)，請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

PAGEPAGE2我國(guó)31個(gè)省市自治區(qū)第三產(chǎn)業(yè)發(fā)展?fàn)顩r分析（數(shù)據(jù)來(lái)源：中宏統(tǒng)計(jì)數(shù)據(jù)庫(kù)）2010年31個(gè)省市第三產(chǎn)業(yè)增加值一、因子分析1.考察原有變量是否適合進(jìn)行因子分析為研究全國(guó)各地區(qū)第三產(chǎn)業(yè)的發(fā)展?fàn)顩r，現(xiàn)比較其第三產(chǎn)業(yè)增加值的差異性和相似性，收集到2010年全國(guó)31個(gè)省市自治區(qū)各類(lèi)第三產(chǎn)業(yè)包括交通運(yùn)輸、倉(cāng)儲(chǔ)和郵政業(yè)，批發(fā)和零售業(yè)，住宿和餐飲業(yè)，金融業(yè)，房地產(chǎn)業(yè)及其他產(chǎn)業(yè)的年增產(chǎn)值數(shù)據(jù)。由于涉及的變量較多，直接進(jìn)行地區(qū)間的比較分析非常繁瑣，因此首先考慮采用因子分析方法減少變量個(gè)數(shù)，之后再進(jìn)行比較和綜合評(píng)價(jià)。表1-1（a）原有變量的相關(guān)系數(shù)矩陣由表1-1（a）可以看到，所有的相關(guān)系數(shù)都很高，各變量呈較強(qiáng)的線性關(guān)系，能夠從中提取公因子，適合做因子分析。表1-1（b）巴特利特球度檢驗(yàn)和KMO檢驗(yàn)由表1（b）可知，巴特利特球度檢驗(yàn)統(tǒng)計(jì)量的觀測(cè)值為295.349，相應(yīng)的概率p接近0,。如果顯著性水平a為0.5，由于概率p小于顯著性水平a，應(yīng)拒絕零假設(shè)，認(rèn)為相關(guān)系數(shù)矩陣與單位矩陣有顯著差異。同時(shí)，KMO值為0.860，根據(jù)Kaiser給出了KMO度量標(biāo)準(zhǔn)可知原有變量適合進(jìn)行因子分析。2.提取因子首先進(jìn)行嘗試性分析。根據(jù)原有變量的相關(guān)系數(shù)矩陣，采用主成分分析法提取因子并選取特征根值大于1的特征根。表1-2（a）因子分析的初始解（一）表1-2（a）顯示了所有變量的共同度數(shù)據(jù)。第一列是因子分析初始解下的變量共同度，表明對(duì)原有6個(gè)變量如果采用主成分分析法提取所有特征根（6個(gè)），那么原有變量的所有方差都可被解釋?zhuān)兞康墓餐染鶠?。第二列是在按指定提取條件提取特征根時(shí)的共同度?？梢钥吹?，所有變量的絕大部分信息（大于84%）可被因子解釋?zhuān)@些變量的共同度均較高，變量的信息丟失較少，只有交通運(yùn)輸這個(gè)變量的信息丟失較多（近20%），因此本次因子提取的總體效果不理想。重新指定特征根的標(biāo)準(zhǔn)，指定提取兩個(gè)因子，結(jié)果如下：表1-2（b）因子分析的初始解（一）表1-2（c）因子解釋變量原有變量總方差的情況表1-2（c）中，第一列是因子編號(hào)，第二列到第四列（第一組數(shù)據(jù)項(xiàng)）描述了初始因子解的情況，第五列到第七列（第二組數(shù)據(jù)項(xiàng)）描述了因子解的情況。從第一組數(shù)據(jù)項(xiàng)中可以看到，第一個(gè)因子的特征根值為5.389，解釋6個(gè)變量總方差的89.825%，累積方差貢獻(xiàn)率也為89.825%。從第二組數(shù)據(jù)項(xiàng)中可以看到，指定提取的一個(gè)因子解釋了原有變量總方差的94.999%，原有變量丟失較少，因子分析效果理想。圖1-2（d）因子的碎石圖在圖1-2(d)中，橫坐標(biāo)為因子數(shù)目，縱坐標(biāo)為特征根?？梢钥吹剑谝粋€(gè)因子的特征根值很高，對(duì)解釋原有變量的貢獻(xiàn)最大；第三個(gè)開(kāi)始，因子的特征根值都較小，對(duì)原有解釋變量的貢獻(xiàn)很小，已經(jīng)成為可被忽略的“高山腳下的碎石”，因此提取兩個(gè)因子是合適的。表1-2(e)因子載荷矩陣表1-2(e)顯示了因子載荷矩陣，是因子分析的核心內(nèi)容，根據(jù)此表可以寫(xiě)出本案例的因子分析模型：批發(fā)和零售業(yè)=0.980a+0.028b房地產(chǎn)業(yè)=0.979a-0.078b其他=0.973a-0.108b住宿和餐飲業(yè)=0.934a+0.140b金融業(yè)=0.919a-0.352b交通運(yùn)輸、倉(cāng)儲(chǔ)和郵政業(yè)=0.898a+0.386b由表5可知，6個(gè)變量在提取的第一個(gè)因子a上的載荷都很高，意味著它們與第一個(gè)因子的相關(guān)程度高，第一個(gè)因子很重要；第二個(gè)因子b與原有變量的相關(guān)性均很小，它對(duì)原有變量的解釋作用不顯著。另外還可以看到，這兩個(gè)因子的實(shí)際含義比較模糊。3.因子的命名解釋采用方差最大法對(duì)因子載荷矩陣實(shí)施正交旋轉(zhuǎn)以使因子具有命名解釋性。指定按第一個(gè)因子載荷降序的順序輸出旋轉(zhuǎn)后的因子載荷以及旋轉(zhuǎn)后的因子載荷圖，結(jié)果如下：表1-3（a）旋轉(zhuǎn)后的因子載荷矩陣由上表可知，金融業(yè)，其他，房地產(chǎn)業(yè)在第一個(gè)因子是上有較高的載荷，第一個(gè)因子主要解釋了這幾個(gè)變量，可解釋為生產(chǎn)和生活服務(wù)的產(chǎn)業(yè)；交通運(yùn)輸和郵政業(yè)，住宿和餐飲業(yè)，批發(fā)和零售業(yè)在第二個(gè)因子上有較高的載荷，第二個(gè)因子主要解釋了這幾個(gè)變量，可解釋為流通服務(wù)的產(chǎn)業(yè)。（其中，批發(fā)和零售業(yè)在兩個(gè)因子上的載荷大致相同，這里把它歸為在第二個(gè)因子上的載荷較高。）與旋轉(zhuǎn)前相比，因子含義較為清晰。表1-3（b）因子旋轉(zhuǎn)中的正交表1-3（c）因子協(xié)方差矩陣由表1-3（c）因子的協(xié)方差矩陣，可以看出，兩個(gè)因子沒(méi)有線性相關(guān)性，實(shí)現(xiàn)了因子分析的設(shè)計(jì)目標(biāo)。圖1-3（d）旋轉(zhuǎn)后的因子載荷圖由上圖可以清晰的看出，交通運(yùn)輸和郵政業(yè)、金融業(yè)比較靠近兩個(gè)因子坐標(biāo)軸，表明如果分別用第一個(gè)因子刻畫(huà)金融業(yè)，用第二個(gè)因子刻畫(huà)交通運(yùn)輸和郵政業(yè)，信息丟失效果較少，效果較好。但如果用一個(gè)因子分別刻畫(huà)其他變量，則效果不是很理想。4.計(jì)算因子得分采用回歸分析法估計(jì)因子得分系數(shù)，并輸出因子得分系數(shù)。表1-4因子得分系數(shù)矩陣根據(jù)該表，可寫(xiě)出一下因子得分函數(shù)：A=-0.733交通運(yùn)輸+0.071批發(fā)和零售-0.184住宿和餐飲+0.903金融+0.304房地產(chǎn)+0.369其他B=1.016交通運(yùn)輸+0.190批發(fā)和零售+0.447住宿和餐飲-0.706金融-0.057房地產(chǎn)-0.128其他可見(jiàn)，計(jì)算兩個(gè)因子得分變量的變量值時(shí)，交通運(yùn)輸郵政業(yè)和金融業(yè)的權(quán)重較高，但方向恰好相反，這與因子的實(shí)際含義是相吻合的。5.各省市自治區(qū)第三產(chǎn)業(yè)增值的綜合評(píng)價(jià)計(jì)算因子綜合得分，并按降序排列，如下表1-5：表1-5因子綜合得分觀察上表可見(jiàn)，廣東，江蘇，山東，浙江的綜合得分較高，與其他地區(qū)差異較大，其他地區(qū)較相似。則第三產(chǎn)業(yè)增加值較高的省市有廣東，江蘇，山東，浙江四個(gè)省，第三產(chǎn)業(yè)發(fā)展最為迅速，它們多屬于沿海地區(qū)，是中國(guó)的四個(gè)最強(qiáng)??；從北京到福建，因子的綜合得分都還是正數(shù)，說(shuō)明這些地區(qū)的第三產(chǎn)業(yè)的發(fā)展較為迅速，沒(méi)有明顯差異；而從內(nèi)蒙古開(kāi)始，一直到西藏，因子綜合得分為負(fù)，其發(fā)展較緩慢，這些地區(qū)的第三產(chǎn)業(yè)增產(chǎn)值比較相似。二、回歸分析對(duì)提取的兩個(gè)因子做回歸分析，因?yàn)橛袃蓚€(gè)因子，所以是多元回歸分析，步驟如下：1.擬合優(yōu)度檢驗(yàn)表2-1強(qiáng)制進(jìn)入策略依據(jù)此表進(jìn)行擬合優(yōu)度檢驗(yàn)。由于是此分析多元回歸分析，方程有多個(gè)解釋變量，因此參考調(diào)整的判定系數(shù)（AdjustedRSquare），由上表：由于R2（0.998）非常接近于1，因此認(rèn)為擬合優(yōu)度很高，被解釋變量稅收合計(jì)能被模型充分解釋。2.回歸方程的顯著性檢驗(yàn)（F檢驗(yàn)）表2-2強(qiáng)制進(jìn)入策略由此表進(jìn)行回歸方程的顯著性檢驗(yàn)。由表可知，被解釋變量的回歸平方和的均方為359431842.0，剩余平方和及其均方分別為1675533和59840.476，對(duì)應(yīng)的概率p值近似為0.。顯著性水平a為0.05，由于概率p小于顯著性水平a，應(yīng)拒絕回歸方程顯著性檢驗(yàn)的零假設(shè)，認(rèn)為各回歸系數(shù)與0存在顯著性差異，不同時(shí)為0，被解釋變量稅收合計(jì)與解釋變量全體的線性關(guān)系顯著，可建立線性模型。3.回歸系數(shù)顯著性檢驗(yàn)（t檢驗(yàn)）表2-3強(qiáng)制進(jìn)入策略依據(jù)此表進(jìn)行回歸系數(shù)顯著性檢驗(yàn)。由表可知，如果顯著性水平a為0.05，所有變量的回歸系數(shù)顯著性t檢驗(yàn)的概率p值都小于顯著水平a，因此這些偏回歸系數(shù)與0有顯著差異，它們與被解釋變量稅收合計(jì)的線性關(guān)系是顯著的，先全部保留在方程中。同時(shí)，從容忍度和方差膨脹因子看，兩個(gè)因子的容忍度和方差膨脹因子都等于1.000（接近于1），所以構(gòu)建模型時(shí)兩個(gè)因子都不必剔除。4.多重共線性檢測(cè)表2-4強(qiáng)制進(jìn)入策略依據(jù)此表進(jìn)行多重共線性檢測(cè)。由表3-4可知，變量的條件指數(shù)均小于10，說(shuō)明多重共線性較弱；另外由表3-3看出，所有變量的容忍度（Tolerance）都接近于1，方差膨脹因子(VIF)都等于1，表示變量間的共線性很弱。因此不必重新建模。因此，由上述分析可以確定回歸方程為：第三產(chǎn)業(yè)增加值=5691.774+3704.595第1因子+3199.702第2因子5.殘差分析圖2-5（a）第三產(chǎn)業(yè)多元回歸分析的殘差圖由圖2-5（a）可以看出，殘差圖中的點(diǎn)在縱坐標(biāo)為0的上下隨機(jī)散落著，殘差的均值為0。圖2-5（b）第三產(chǎn)業(yè)增加值多元線性回歸分析的殘差累計(jì)概率圖由圖2-5（b）可知，所有的觀測(cè)值都接近于直線，表明標(biāo)準(zhǔn)化殘差與正態(tài)分布不存在顯著差異，即觀測(cè)值符合正態(tài)分布，則殘差滿足了線性模型的前提要求。6.異方差分析表2-6標(biāo)準(zhǔn)化殘差和標(biāo)準(zhǔn)化預(yù)測(cè)值的Spearman等級(jí)相關(guān)分析結(jié)果由表2-6可見(jiàn)，殘差與預(yù)測(cè)值的Spearman等級(jí)相關(guān)系數(shù)為0.129，且因?yàn)閜(0.490)>a(0.05)檢驗(yàn)并不顯著，因此認(rèn)為異方差現(xiàn)象并不明顯。7.異常值和強(qiáng)影響點(diǎn)分析由下圖數(shù)據(jù)編輯窗口中的異常值檢驗(yàn)結(jié)果可知，所有的異常值的絕對(duì)值都小于3，所以在所有的觀測(cè)值中，不存在異常值和強(qiáng)影響點(diǎn)。圖2-7異常值檢測(cè)三、K-Means聚類(lèi)分析下面仍然利用這組數(shù)據(jù)（2010年全國(guó)31個(gè)省市自治區(qū)第三產(chǎn)業(yè)增加值），對(duì)地區(qū)進(jìn)行K-Means聚類(lèi)分析，在本次實(shí)驗(yàn)中，要求將其分成3類(lèi)，初始類(lèi)中心點(diǎn)由SPSS自行確定（K-Means聚類(lèi)分析中類(lèi)的歸屬是不斷調(diào)整的，而層次聚類(lèi)分析中樣本所屬類(lèi)一旦確定就不會(huì)再改變，其執(zhí)行效果不理想，所以這里選用K-Means聚類(lèi)分析）。結(jié)果如下：表3-1（a）31個(gè)省市自治區(qū)第三產(chǎn)業(yè)增加值的K-Means聚類(lèi)分析結(jié)果（一）表3-1（a）展示了3個(gè)類(lèi)的初始類(lèi)中心的情況。3個(gè)初始類(lèi)中心點(diǎn)的數(shù)據(jù)分別是表中Cluster中第1、2、3列所示，其中3中的各指數(shù)都是最高的，2最低，1的各指數(shù)都處在2,3的中間，由此可知，第3類(lèi)各指數(shù)都是最優(yōu)的，第1類(lèi)次之，第2類(lèi)各指數(shù)最不理想。表3-231個(gè)省市自治區(qū)第三產(chǎn)業(yè)增加值的K-Means聚類(lèi)分析結(jié)果（二）表3-2展示了3個(gè)類(lèi)中心點(diǎn)每次迭代時(shí)的偏移情況。從表中可以看出，第一次迭代后，3個(gè)類(lèi)的中心點(diǎn)分別偏移了2993.864,2581.016,2130.739，第1類(lèi)中心點(diǎn)偏移最大；第二次迭代后，3個(gè)類(lèi)的中心點(diǎn)的偏移分別為672.344,0.000,1760.726，第3類(lèi)中心點(diǎn)偏移最大第2類(lèi)以及小于指定的判定標(biāo)準(zhǔn)（0.02）；第三次迭代后，3個(gè)類(lèi)的中心點(diǎn)偏移均小于指定的判定標(biāo)準(zhǔn)（0.02），則聚類(lèi)分析結(jié)束。表3-331個(gè)省市自治區(qū)第三產(chǎn)業(yè)增加值的K-Means聚類(lèi)分析結(jié)果（三）表3-3展示了3個(gè)類(lèi)的最終類(lèi)中心的情況，3個(gè)最終類(lèi)中心點(diǎn)的數(shù)據(jù)分別是表中Cluster中第1、2、3列所示，仍然可見(jiàn)，第3類(lèi)各指數(shù)均是最優(yōu)的，第1類(lèi)次之，第2類(lèi)各指數(shù)均最不理想。表3-431個(gè)省市自治區(qū)第三產(chǎn)業(yè)增加值的K-Means聚類(lèi)分析結(jié)果（四）表3-4展示了3個(gè)類(lèi)的類(lèi)成員情況。第1類(lèi)（中游水平）有10個(gè)省市，第2類(lèi)（下游水平）有18個(gè)省市，第3類(lèi)（上游水平）有3個(gè)省市。表3-531個(gè)省市自治區(qū)第三產(chǎn)業(yè)增加值的K-Means聚類(lèi)分析結(jié)果（五）表3-5展示了各指數(shù)在不同類(lèi)的均值比較情況，各數(shù)據(jù)項(xiàng)的含義依次為：組間均方，組間自由度，組內(nèi)均方，組內(nèi)自由度。通過(guò)該表可以看出，各指數(shù)的均值在3類(lèi)中

人人文庫(kù)> 全部分類(lèi)> 應(yīng)用文書(shū) > 作業(yè)報(bào)告

溫馨提示

1. 本站所有資源如無(wú)特殊說(shuō)明，都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
2. 本站的文檔不包含任何第三方提供的附件圖紙等，如果需要附件，請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
3. 本站RAR壓縮包中若帶圖紙，網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽，若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間，僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理，對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯，并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容，請(qǐng)與我們聯(lián)系，我們立即糾正。
7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

應(yīng)用統(tǒng)計(jì)學(xué)實(shí)驗(yàn)報(bào)告(spss軟件)

文檔簡(jiǎn)介

溫馨提示

最新文檔

評(píng)論

應(yīng)用統(tǒng)計(jì)學(xué)實(shí)驗(yàn)報(bào)告(spss軟件)

文檔簡(jiǎn)介

溫馨提示

最新文檔

評(píng)論

相關(guān)文檔