多元分析分析課程實(shí)驗(yàn)指導(dǎo)書Txj_第1頁
多元分析分析課程實(shí)驗(yàn)指導(dǎo)書Txj_第2頁
多元分析分析課程實(shí)驗(yàn)指導(dǎo)書Txj_第3頁
多元分析分析課程實(shí)驗(yàn)指導(dǎo)書Txj_第4頁
多元分析分析課程實(shí)驗(yàn)指導(dǎo)書Txj_第5頁
已閱讀5頁,還剩14頁未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

1、多元統(tǒng)計(jì)分析實(shí)驗(yàn)指導(dǎo)書一、實(shí)驗(yàn)教學(xué)簡介«多元統(tǒng)計(jì)分析»是統(tǒng)計(jì)學(xué)本科專業(yè)的專業(yè)必修課,同時(shí)也是核心課程,尤其強(qiáng)調(diào)理論與實(shí)踐的有機(jī)結(jié)合。實(shí)驗(yàn)教學(xué)是該課程教學(xué)中的重要組成部分。實(shí)驗(yàn)教學(xué)的主要內(nèi)容有:多元正態(tài)總體均值向量的假設(shè)檢驗(yàn),聚類分析,判別分析,主成分分析,因子分析等。本實(shí)驗(yàn)教學(xué)主要采用國際權(quán)威統(tǒng)計(jì)軟件Spss軟件進(jìn)行統(tǒng)計(jì)分析。實(shí)驗(yàn)數(shù)據(jù)收集自各類調(diào)查研究報(bào)告、統(tǒng)計(jì)年鑒、數(shù)據(jù)網(wǎng)站、教學(xué)參考書的案例等。二、實(shí)驗(yàn)教學(xué)目的與任務(wù)通過對本課程的實(shí)驗(yàn)教學(xué),要使學(xué)生對多元統(tǒng)計(jì)分析的基本概念、基本原理、基本方法有一個直觀的認(rèn)識,能熟練應(yīng)用多元統(tǒng)計(jì)分析方法處理多維數(shù)據(jù),培養(yǎng)學(xué)生利用多元統(tǒng)計(jì)分析

2、方法對社會經(jīng)濟(jì)現(xiàn)象及自然現(xiàn)象作定量分析的能力,并受到多元統(tǒng)計(jì)分析思想方法的熏陶,以此提高學(xué)生解決實(shí)際問題的基本素質(zhì),鍛煉學(xué)生的動手能力和獨(dú)立思考能力。三、實(shí)驗(yàn)內(nèi)容與基本要求實(shí)驗(yàn)一: 多元正態(tài)總體的均值和方差的假設(shè)檢驗(yàn)(綜合性實(shí)驗(yàn)) (2課時(shí))實(shí)驗(yàn)原理:利用正態(tài)檢驗(yàn)統(tǒng)計(jì)量對給定的多維數(shù)據(jù)進(jìn)行正態(tài)性檢驗(yàn)。實(shí)驗(yàn)?zāi)康?(1)掌握單一多元正態(tài)總體均值的檢驗(yàn);(2)掌握兩個多元正態(tài)總體均值向量的檢驗(yàn)。 實(shí)驗(yàn)內(nèi)容 :單一多元正態(tài)總體均值向量的檢驗(yàn),有相等已知協(xié)差陣的兩個正態(tài)總體均值向量的檢驗(yàn),有相等未知協(xié)差陣的兩個正態(tài)總體均值向量的檢驗(yàn),協(xié)差陣不等的兩個正態(tài)總體均值向量的檢驗(yàn)。 實(shí)驗(yàn)題目:1、多元總體的單樣

3、本檢驗(yàn)(協(xié)差陣未知) 人的出汗多少與人體內(nèi)鈉和鉀的含量有一定的關(guān)系。今測20名健康成年女性的出汗多少(X1)、鈉的含量(X2)和鉀的含量(X3),其數(shù)據(jù)如下所示: 試檢驗(yàn) 2、多元兩樣本檢驗(yàn)(有共同未知協(xié)差) 為了研究日、美兩國在華投資企業(yè)對中國經(jīng)營環(huán)境的評價(jià)是否存在差異,今從兩國在華投資企業(yè)中各抽出10家,讓其對中國的政治、經(jīng)濟(jì)、法律、文化等環(huán)境進(jìn)行打分,其結(jié)果如表所示,110號為美國在華投資企業(yè)的代號,1120號為日本在華投資企業(yè)的代號。設(shè)兩組樣本來自正態(tài)總體X和Y,且兩組樣本相互獨(dú)立,協(xié)差陣相等但未知。 檢驗(yàn) 基本要求: 對原假設(shè)作假設(shè)檢驗(yàn)(0.05),構(gòu)造檢驗(yàn)統(tǒng)計(jì)量,并給出檢驗(yàn)結(jié)果。實(shí)

4、驗(yàn)步驟:第一步:建立Spss數(shù)據(jù)集;第二步:對原假設(shè)構(gòu)造檢驗(yàn)統(tǒng)計(jì)量;第三步:編程計(jì)算檢驗(yàn)結(jié)果;第四步:依據(jù)輸出結(jié)果對原假設(shè)作判斷。實(shí)驗(yàn)二: 聚類分析(設(shè)計(jì)性實(shí)驗(yàn)) (2課時(shí))實(shí)驗(yàn)原理:聚類分析的目的是將分類對象按一定規(guī)則分為若干類,這些類不是事先給定的,而是根據(jù)數(shù)據(jù)的特征確定的。在同一類里的這些對象在某種意義上傾向于彼此相似,而在不同的類里的對象傾向于不相似。系統(tǒng)聚類法是聚類分析中用的最多的一種,其基本思想是:開始將n個對象各自作為一類,并規(guī)定對象之間的距離和類與類之間的距離,然后將距離最近的兩類合并成一個新類,計(jì)算新類與其它類之間的距離;重復(fù)進(jìn)行兩個最近類的合并,每次減少一類,直至所有的對象

5、合并為一類。實(shí)驗(yàn)?zāi)康呐c要求:聚類分析的目的是將分類對象按一定規(guī)則分為若干類,這些類不是事先給定的,而是根據(jù)數(shù)據(jù)的特征確定的。在同一類里的這些對象在某種意義上傾向于彼此相似,而在不同的類里的對象傾向于不相似。SPSS中的聚類分析:1). K-means Cluster 快速聚類1. Method方法(1) Iterate and Classify迭代且分類(2) Classify Only只分類2. Cluster Centers聚類中心3. Iterate迭代4. Statistics統(tǒng)計(jì)(1) Initial Cluster Centers初始聚類中心(2) ANOVA Table方差分析表

6、(3) Cluster Information For Each Case每個樣品的聚類資料(4)2). Hierarchical Cluster 系統(tǒng)聚類1、 聚類類別(1) 樣品(2) 變量2.Statistics統(tǒng)計(jì)(1) Agglomeration Scheduce聚類一覽表(2) Distance Matrix距離矩陣3.Plot圖(1) Dendrogram樹型譜系圖(2) Icicle水平柱譜系圖(3) Orientation4.Method方法(1) Between-groups Linkage類間平均(2) Within-groups Linkage類內(nèi)平均(3) Neare

7、st neighbor最短距離(4) Furthest neighbor最長距離(5) Centroid Clustering重心法(6) Median Clustering中間距離(7) Ward Method離差平方和5. (1) Interval區(qū)間Squared Euclidean distance平方歐氏距離Euclidean distance歐氏距離Cosline夾角余弦Pearson Correlation皮爾遜相關(guān)Chebychev切比雪夫距離Block絕對值Minkowski明考斯基Customized(2) Counts記數(shù)Chi-square measurePhi-squ

8、are measure(3) Binary二元Squared Euclidean distance平方歐氏距離Euclidrean distance歐氏距離Size difference大小區(qū)間Pattern difference模式區(qū)別Variance方差Shape形狀Lance and Williams實(shí)驗(yàn)內(nèi)容: 1. 快速聚類分析 為研究兒童生長發(fā)育的分期,調(diào)查1253名1個月至7歲兒童的身高、體重、胸圍和坐高資料。資料作如下整理:先把1個月至7歲劃成19個月份算出各指標(biāo)的平均值,將第1月的各指標(biāo)平均值與出生時(shí)的各指標(biāo)平均值比較,求出月平均增長率(%),然后第2月起的各月份指標(biāo)平均值均與

9、前一月比較,也起初月平均增長率(%),如下表;欲將兒童生長發(fā)育分為四期,故指定聚類的類別數(shù)為4,請通過聚類分析確定四個兒童生長發(fā)育期的起止區(qū)間。月份月平均增長率(%)身高(cm)體重(kg)胸圍(cm)坐高(cm)111.0350.3011.8111.2725.4719.305.207.1833.589.853.142.1142.014.171.471.5862.135.651.042.1182.061.740.171.57101.632.041.041.46121.171.600.890.76151.032.340.530.89180.691.330.480.58240.771.410.52

10、0.42300.591.250.300.14360.651.190.490.38420.510.930.160.25480.731.130.350.55540.530.820.160.34600.360.520.190.21660.521.030.300.55720.340.490.180.16建立數(shù)據(jù)文件,變量month標(biāo)示月份;變量X1、X2、X3、X4分別標(biāo)示身高、體重、胸圍和坐高。試驗(yàn)步驟:激活A(yù)nalyze菜單選Classify中的K-Means Cluster項(xiàng),彈出K-Means Cluster Analysis對話框,從對話框左側(cè)的變量列表中選x1、x2、x3、x4,點(diǎn)擊向右的

11、按鈕使之進(jìn)入Variables框;在Number of Cluster(聚類分析的類別數(shù))處輸入需要聚合的組數(shù),本例為4,在聚類方法上有兩種:Iterate and classify指先定初始類別中心點(diǎn),而后按K-means算法作疊代分類;Classify only指僅按處世類別中心點(diǎn)分類,本例選用前一方法。為在原始數(shù)據(jù)庫中逐一顯示分類結(jié)果,點(diǎn)擊Save按鈕彈出K-Means Cluster: SaveNew Variables對話框,選擇Cluster membership項(xiàng),點(diǎn)擊Continue按鈕返回K-Means Cluster Analysis對話框。本例還要求對聚類結(jié)果進(jìn)行方差分析

12、,故點(diǎn)擊Options按鈕彈出來K-Means Cluster Optons對話框,在Statistics欄中選擇ANOVA table項(xiàng),點(diǎn)擊Continue按鈕返回K-Means Cluster Analysis對話框,再點(diǎn)擊OK按鈕提交運(yùn)行過程。分層聚類分析:29名兒童的血紅蛋白(g/100ml)與微量元素(/100ml)測量結(jié)果建立的數(shù)據(jù)文件如下:由于微量元素的測量成本高、耗時(shí)長,故希望通過聚類分析(既R型指標(biāo)聚類)篩選代表性指標(biāo),以便更經(jīng)濟(jì)、快捷地評價(jià)兒童的營養(yǎng)狀態(tài)。X1X2X3X4X5X6154.8930.86448.700.011.0113.50272.4942.61467.30

13、0.011.6413.00353.8152.86425.610.001.2213.75464.7439.18469.800.011.2214.00558.8037.67456.550.011.0114.25643.6726.18395.780.000.5912.75754.8930.86448.700.011.0112.50886.1243.79440.130.021.7712.25960.3538.20394.400.001.1412.001054.0434.23405.600.011.3011.751161.2337.35446.000.021.3811.501260.1733.67383

14、.200.000.9111.251369.6940.01416.700.011.3511.001472.2840.12430.800.001.2010.751555.1333.02445.800.010.9210.501670.0836.81409.800.011.1910.251763.0535.07384.100.000.8510.001848.7530.53342.900.020.929.751952.2827.14326.290.000.829.502052.2136.18388.540.021.029.252149.7125.43331.100.010.909.002261.0229

15、.27258.940.021.198.752353.6828.79292.800.051.328.502450.2229.17292.600.011.048.252565.3429.99312.800.011.038.002656.3929.29283.000.021.357.802766.1231.93344.200.000.697.502873.8932.94312.500.061.157.252947.3128.55294.700.010.847.00其中變量X1、X2、X3、X4、X5、X6分別標(biāo)示鈣、鎂、鐵、錳、銅、和血紅蛋白。試驗(yàn)步驟:從Analyze菜單Classify中的Hie

16、rarchical Cluster項(xiàng),彈出Hierarchical Cluster Analysis對話框。從對話框左側(cè)的變量中選x1、x2、x3、x4、x5、X6,點(diǎn)擊向右的箭頭按鈕使之進(jìn)入Variable(s)框;在Cluster處選擇聚類類型,其中Cases表示觀察對象聚類,Variables表示變量聚類,本例選擇Variables點(diǎn)擊statistics按鈕,彈出Hierarchical Cluster Analysis:Statistics對話框,選擇Proximty matrix,要求顯示歐氏不相識系數(shù)平方矩陣,點(diǎn)擊Continue按鈕返回Hierarchical Cluster

17、Analysis對話框。本例要求系統(tǒng)輸出聚類結(jié)果的樹狀關(guān)系圖,故點(diǎn)擊Plots按鈕彈出Hierarchical Cluster Analysis:Plots對話框,選擇Dendrogram項(xiàng),點(diǎn)擊Continue按鈕返回Hierarchical Cluster Analysis對話框。點(diǎn)擊Method按鈕彈出Hierarchical Cluster Analysis:Method對話框,系統(tǒng)提供了7種聚類方法共用戶選擇,本例選擇類間平均連鎖法(昨天默認(rèn)方法)對選擇距離測量技術(shù)時(shí),系統(tǒng)提供了8種形式供用戶選擇,本例選用Pearson correlation,點(diǎn)擊Continue按鈕返回Hiera

18、rchical Cluster Analysis對話框,再點(diǎn)擊OK按鈕即完成分析。根據(jù)實(shí)驗(yàn)結(jié)果寫出實(shí)驗(yàn)結(jié)果分析報(bào)告。實(shí)驗(yàn)三:判別分析(設(shè)計(jì)性實(shí)驗(yàn))(2課時(shí))實(shí)驗(yàn)原理:判別分析是判別樣品所屬類型的一種統(tǒng)計(jì)方法。判別分析是在已知研究對象分成若干類型(或組別)并已取得各種類型的一批已知樣品的觀測數(shù)目,在此基礎(chǔ)上根據(jù)某些準(zhǔn)則建立判別式,然后對未知類型的樣品進(jìn)行判別分類。本實(shí)驗(yàn)要求學(xué)生應(yīng)用距離判別準(zhǔn)則(即,對任給的一次觀測,若它與第i類的重心距離最近,就認(rèn)為它來自第i類),對兩總體和多總體情形下分別進(jìn)行判別分析。實(shí)驗(yàn)中需注意協(xié)方差矩陣相等時(shí),選取線性判別函數(shù);協(xié)方差矩陣不相等時(shí),應(yīng)選取二次判別函數(shù)。實(shí)驗(yàn)

19、目的及要求: 判別分析是判別樣品所屬類型的一種統(tǒng)計(jì)方法。本實(shí)驗(yàn)要求學(xué)生應(yīng)用距離判別準(zhǔn)則(即,對任給的一次觀測,若它與第i類的重心距離最近,就認(rèn)為它來自第i類),對兩總體和多總體情形下分別進(jìn)行判別分析。實(shí)驗(yàn)中需注意協(xié)方差矩陣相等時(shí),選取線性判別函數(shù);協(xié)方差矩陣不相等時(shí),應(yīng)選取二次判別函數(shù)。SPSS中的判別分析從Analyze中主菜單中選擇ClassifyDiscriminant1). Select指定選擇變量的取值2). Statistics1. Descriptives描述統(tǒng)計(jì)量(1) Means均值(2) Univariate ANOVAs單因子方差分析量(3) Boxs MBoxs M檢驗(yàn)

20、 檢驗(yàn)類協(xié)方差矩陣齊性2. Function Coefficients函數(shù)系數(shù)(1) FishersFishers線性判別函數(shù)系數(shù)(2) Unstandardized 非標(biāo)準(zhǔn)化線性判別函數(shù)系數(shù)3. Matrices矩陣(1) Within-groups correlation類內(nèi)相關(guān)矩陣(2) Within-groups covariance類內(nèi)協(xié)方差矩陣(3) Separate-groups covariance 類協(xié)方差陣(4) Total Covariance總協(xié)方差矩陣3). Method逐步判別方法(1) Wilks lambda 維爾克斯統(tǒng)計(jì)量最小者入選(2) Unexplaine

21、d variance具有最小非解釋方差者入選(3) Mahalanobis distance兩類間具有最大馬氏聚類者入選(4) Smallest F ratioF比值最小者入選(5) Raos Raos統(tǒng)計(jì)量V值產(chǎn)生最大增殖的變量入選4). Classification分類1. Prior Probabilities給分類樣品提供先驗(yàn)概率值(1) All groups equal相等先驗(yàn)概率值(2) Compute from group sizes樣品頻率代替先驗(yàn)概率值2. Use Covariance Mathix用協(xié)方差矩陣(1) Within-groups 類內(nèi)協(xié)方差矩陣(2) Sepa

22、rate-groups類協(xié)方差矩陣3.Plots圖形(1) Combined-groups全部類散點(diǎn)圖或直方圖(2) Separate-groups分類散點(diǎn)圖或直方圖(3) Territorial map 區(qū)域圖4.Display顯示(1) Results for each case每個樣品的分類信息(2) Summary table 分類結(jié)果表X1X2result19.865.18213.333.731314.663.89149.337.101512.805.491610.664.091710.664.451813.333.631913.335.9611013.335.7011112.006

23、.1911214.664.0111313.334.0111412.803.6311513.335.961實(shí)驗(yàn)內(nèi)容: 為研究舒張期血壓和血漿膽固醇對冠心病的作用,某醫(yī)師測定了5059歲冠心病人15例和正常人16例的舒張壓和膽固醇指標(biāo)建立數(shù)據(jù)文件如下:試作判別分析,建立判別函數(shù)。X1X2result1610662.0721712.534.4521813.333.062199.333.9422010.664.4522110.664.922229.333.6822310.662.7722410.663.2122510.665.0222610.403.942279.334.9222810.662.692

24、2910.662.4323011.203.422319.333.632其中變量X1、X2分別表示舒張壓、膽固醇;變量result=1表示冠心病資料;result=2表示正常人資料。試驗(yàn)步驟:從Anslyze菜單ClassifyDicriminant項(xiàng),彈出Discriminant Analysis對話框。從對話框左側(cè)的變量列表中選result,單擊向右的箭頭按鈕使進(jìn)入Grouping Variable框;并點(diǎn)擊Define Range鈕,在彈出的Discriminant Analysis:Define Range對話框中,定義判別原始數(shù)據(jù)的類別區(qū)間。本例為兩類,故在Minimum處輸入1、在M

25、aximum處輸入2,點(diǎn)擊Continue鈕返回Discriminant Analysis對話框。再從對話框左側(cè)的變量列表中選x1、x2,點(diǎn)擊向右的箭頭按鈕使進(jìn)入Independeents框,作為判別分析的基礎(chǔ)數(shù)據(jù)變量.系統(tǒng)提供兩類判別方式供選擇,一類是Enter Independent together,即判別的原始變量全部進(jìn)入判別方程;另一類是Use stepwise method,即采用逐步的方法選擇變量進(jìn)入方程。本例由于變量數(shù)僅為2個,傾向讓兩個變量均進(jìn)入方程,故選用Enter Independent together判別方式。點(diǎn)擊Statistics按鈕,彈出Discriminant

26、 Analysis:Statistics對話框,在Descriptive欄中選Means項(xiàng),要求對各組的個變量作均數(shù)與標(biāo)準(zhǔn)差的描述;在Function Coefficients欄中選Unstandardized項(xiàng),要求顯示判別方程的非標(biāo)準(zhǔn)化系數(shù),之后點(diǎn)擊Continue按鈕返回Discriminant Analysis對話框。點(diǎn)擊Classify按鈕,彈出Discriminant Analysis:Classification對話框,在Plot欄選Combined groups項(xiàng),要求作合并的判別結(jié)果分布圖;在Display欄中選Casewise Results項(xiàng),要求對原始資料根據(jù)建立的判別

27、方程作逐一回代重判別,同時(shí)選Summary table項(xiàng),要求對這種回代判別結(jié)果進(jìn)行總結(jié)評價(jià)。之后,點(diǎn)擊Continue按鈕返回Discriminant Analysis對話框。點(diǎn)擊Save按鈕,彈出Discriminant Analysis:Save New Variables對話框,選Predicted group membership項(xiàng)要求將回代判別的結(jié)果存入原始數(shù)據(jù)庫中。點(diǎn)擊Continue按鈕返回Discriminant Analysis對話框,之后再點(diǎn)擊OK按鈕即完成分析。根據(jù)實(shí)驗(yàn)結(jié)果寫出實(shí)驗(yàn)結(jié)果分析報(bào)告。實(shí)驗(yàn)四:主成分分析(設(shè)計(jì)性實(shí)驗(yàn)) (2課時(shí))實(shí)驗(yàn)原理:主成分分析利用指標(biāo)之間

28、的相關(guān)性,將多個指標(biāo)轉(zhuǎn)化為少數(shù)幾個綜合指標(biāo),從而達(dá)到降維和數(shù)據(jù)結(jié)構(gòu)簡化的目的。這些綜合指標(biāo)反映了原始指標(biāo)的絕大部分信息,通常表示為原始指標(biāo)的某種線性組合,且綜合指標(biāo)間不相關(guān)。利用矩陣代數(shù)的知識可求解主成分。實(shí)驗(yàn)?zāi)康募耙螅褐鞒煞址治隼弥笜?biāo)之間的相關(guān)性,將多個指標(biāo)轉(zhuǎn)化為少數(shù)幾個綜合指標(biāo),從而達(dá)到降維和數(shù)據(jù)結(jié)構(gòu)簡化的目的。這些綜合指標(biāo)反映了原始指標(biāo)的絕大部分信息,通常表示為原始指標(biāo)的某種線性組合,且綜合指標(biāo)間不相關(guān)。利用矩陣代數(shù)的知識可求解主成分。SPSS中的主成分分析:從Analyze菜單中選取 Data ReductionFactor從對話框中選取ExtractionMethodPrinci

29、pal components 主成分法實(shí)驗(yàn)題目:下表中給出了不同國家及地區(qū)的男子徑賽記錄:Country100m (s)200m (s)400m (s)800m (min)1500m (min)5000m (min)10,000m (min)Marathon (mins)Argentina10.3920.8146.841.813.714.0429.36137.72Australia10.3120.0644.841.743.5713.2827.66128.3Austria10.4420.8146.821.793.613.2627.72135.9Belgium10.3420.6845.041.73

30、3.613.2227.45129.95Bermuda10.2820.5845.911.83.7514.6830.55146.62Brazil10.2220.4345.211.733.6613.6228.62133.13Burma10.6421.5248.31.83.8514.4530.28139.95Canada10.1720.2245.681.763.6313.5528.09130.15Chile10.3420.846.21.793.7113.6129.3134.03China10.5121.0447.31.813.7313.929.13133.53Columbia10.4321.0546.

31、11.823.7413.4927.88131.35Cook Islands12.1823.252.942.024.2416.735.38164.7Costa Rica10.9421.948.661.873.8414.0328.81136.58Czechoslovakia10.3520.6545.641.763.5813.4228.19134.32Denmark10.5620.5245.891.783.6113.528.11130.78Dominican Republic10.1420.6546.81.823.8214.9131.45154.12Finland10.4320.6945.491.7

32、43.6113.2727.52130.87France10.1120.3845.281.733.5713.3427.97132.3German (D.R.)10.1220.3344.871.733.5613.1727.42129.92German (F.R.)10.1620.3744.51.733.5313.2127.61132.23Great Brit.& N. Ireland10.1120.2144.931.73.5113.0127.51129.13Greece10.2220.7146.561.783.6414.5928.45134.6Guatemala10.9821.8248.4

33、1.893.814.1630.11139.33Hungary10.2620.6246.021.773.6213.4928.44132.58India10.621.4245.731.763.7313.7728.81131.98Indonesia10.5921.4947.81.843.9214.7330.79148.83Ireland10.6120.9646.31.793.5613.3227.81132.35Israel10.712147.81.773.7213.6628.93137.55Italy10.0119.7245.261.733.613.2327.52131.08Japan10.3420

34、.8145.861.793.6413.4127.72128.63Kenya10.4620.6644.921.733.5513.127.38129.75Korea10.3420.8946.91.793.7713.9629.23136.25D.P.R Korea10.9121.9447.31.853.7714.1329.67130.87Luxembourg10.3520.7747.41.823.6713.6429.08141.27Malaysia10.420.9246.31.823.814.6431.01154.1Mauritius11.1922.4547.71.883.8315.0631.771

35、52.23Mexico10.4221.346.11.83.6513.4627.95129.2Netherlands10.5220.9545.11.743.6213.3627.61129.02New Zealand10.5120.8846.11.743.5413.2127.7128.98Norway10.5521.1646.711.763.6213.3427.69131.48Papua New Guinea10.9621.7847.91.94.0114.7231.36148.22Philippines10.7821.6446.241.813.8314.7430.64145.27Poland10.

36、1620.2445.361.763.613.2927.89131.58Portugal10.5321.1746.71.793.6213.1327.38128.65Rumania10.4120.9845.871.763.6413.2527.67132.5Singapore10.3821.2847.41.883.8915.1131.32157.77Spain10.4220.7745.981.763.5513.3127.73131.57Sweden10.2520.6145.631.773.6113.2927.94130.63Switzerland10.3720.4645.781.783.5513.2

37、227.91131.2Taipei10.5921.2946.81.793.7714.0730.07139.27Thailand10.3921.0947.911.833.8415.2332.56149.9Turkey10.7121.4347.61.793.6713.5628.58131.5USA9.9319.7543.861.733.5313.227.43128.22USSR10.072044.61.753.5913.227.53130.55Western Samoa10.8221.86492.024.2416.2834.71161.83(數(shù)據(jù)來源:1984年洛杉機(jī)奧運(yùn)會IAAF/AFT徑賽與田

38、賽統(tǒng)計(jì)手冊)試對這八項(xiàng)男子徑賽運(yùn)動項(xiàng)目進(jìn)行主成分分析?;疽螅?(1)運(yùn)用主成分分析的思想將這八項(xiàng)徑賽運(yùn)動項(xiàng)目化為少數(shù)互相無關(guān)的綜合指標(biāo),并盡可能查閱相關(guān)專業(yè)知識解釋這些綜合指標(biāo)的含義。(2)試用方差累積貢獻(xiàn)率確定主成分的個數(shù)。(3)計(jì)算各國第一主成分的得分并排名。實(shí)驗(yàn)步驟:第一步:建立SAS數(shù)據(jù)集;第二步:消除量綱影響;第三步:調(diào)用PRINCOMP過程求主成分;第四步:由輸出結(jié)果中的貢獻(xiàn)率確定前幾個主成分,并結(jié)合相關(guān)專業(yè)知識給各主成分所蘊(yùn)藏的信息以恰當(dāng)?shù)慕忉專坏谖宀剑河?jì)算各國第一主成分的得分并排名,并解釋排名結(jié)果的意義。 實(shí)驗(yàn)五: 因子分析 (研究創(chuàng)新性實(shí)驗(yàn)) (2課時(shí))實(shí)驗(yàn)原理:因子分析

39、是主成分分析的推廣和發(fā)展,其目的是用少數(shù)幾個不可觀測的隱變量,即因子,來解釋原始變量之間的相關(guān)關(guān)系,它也是屬于多元分析中處理降維的一種統(tǒng)計(jì)方法。因子分析的基本思想是通過變量間的協(xié)方差矩陣(或相關(guān)系數(shù)矩陣)內(nèi)部結(jié)構(gòu)的研究,尋找能控制所有變量的少數(shù)幾個因子去描述多個變量之間的相關(guān)關(guān)系。實(shí)驗(yàn)?zāi)康募耙螅阂蜃臃治鍪侵鞒煞址治龅耐茝V和發(fā)展,其目的是用少數(shù)幾個不可觀測的隱變量,即因子,來解釋原始變量之間的相關(guān)關(guān)系,它也是屬于多元分析中處理降維的一種統(tǒng)計(jì)方法。SPSS中的因子分析:從Analyze菜單中選取Data ReductionFactor1). Descriptive1、 Statistics統(tǒng)計(jì)U

40、nivariate Descriptive 有效樣品數(shù)、均值、標(biāo)準(zhǔn)差I(lǐng)nitial Solution初始公因子方差估計(jì)、特征值、方差百分比2.Correlation Matrix 相關(guān)矩陣(1) Coefficients系數(shù)(2) Significance Levels 對相關(guān)系數(shù)進(jìn)行顯著性檢驗(yàn)的顯著性水平矩陣(3) Determinant相關(guān)陣的行列(4) Kmo-Bartletts相關(guān)程度檢驗(yàn)值和一致性檢驗(yàn)(5) Inverse相關(guān)陣的逆矩陣(6) Reproduced再生相關(guān)陣(7) Anti-image反象因子協(xié)方差2). Extraction因子模型陣1. Method 方法(1)

41、Principal Conponents主成分法(2) Unweighted Least Squares未加權(quán)最小乘(3) Generalized Least Squares最小二乘(4) Maximum Likelihood最大似然估計(jì)(5) Principal-axis Factoring主軸因子法(6) Alpha Factoring方法(7) Image Factoring象因子法2. Extract選取因子(1) Eigenvalues Over按降序繪出因子特征根散點(diǎn)圖(2) Number of Factors因子數(shù)3. Display顯示(1) Unrotated Factor

42、Solution未旋轉(zhuǎn)因子結(jié)果(2) Scree Plot散點(diǎn)圖3). Rotation旋轉(zhuǎn)1. Varimax方差極大正交旋轉(zhuǎn)2. Equamax等向方差極大正交旋轉(zhuǎn)3. Quartimax四次方差極大正交旋轉(zhuǎn)4. Direct Oblimin斜交變換旋轉(zhuǎn)4). Factor Scores因子得分MethodRegression回歸BartlettAnderson-Rubin例: 25名健康人的7項(xiàng)生化檢驗(yàn)指標(biāo)結(jié)果文件如下:,7項(xiàng)生化檢驗(yàn)指標(biāo)依次命名為X1至X7,請對該資料進(jìn)行因子分析。X1X2X3X4X5X6X713.763.660.545.289.7713.744.7828.594.99

43、1.3410.027.5010.162.1336.226.144.529.842.172.731.0947.577.287.0712.661.792.100.8259.037.082.5911.764.546.221.2865.513.981.306.925.337.302.4073.270.620.443.367.638.848.3988.747.003.3111.683.534.761.1299.649.491.0313.5713.1318.522.35109.731.331.009.879.8711.063.70118.592.981.179.177.859.912.62127.125.

44、493.689.722.643.431.19134.693.012.175.982.763.552.01145.511.341.275.814.575.383.43151.661.611.572.801.782.093.72165.905.761.558.845.407.501.97179.849.271.5113.609.0212.671.75188.394.922.5410.053.965.241.43194.944.381.036.686.499.062.81207.232.301.777.794.395.372.27219.467.311.0412.0011.5816.182.4222

45、9.555.354.2511.742.773.511.05234.944.524.508.071.792.101.25248.213.082.429.103.754.661.72259.416.645.1112.502.453.100.91操作過程如下;從AnalyzeData ReductionFactor,彈出Factor Analyze對話框。在對話框左側(cè)的變量列表中選擇變量X1至X7,點(diǎn)擊向右的箭頭按鈕使之進(jìn)入Variables框,點(diǎn)擊Descriptives按鈕,彈出Factor Analysis:Descriptives對話框,在Statistics中選Univariatedesc

46、riptives項(xiàng)要求輸出各變量的均數(shù)與標(biāo)準(zhǔn)差,在Correlation Matrix欄內(nèi)選Coefficients項(xiàng)要求計(jì)算相關(guān)系數(shù)矩陣,并KMO and Bartlets test of sphericity選項(xiàng),要求對相關(guān)系數(shù)矩陣進(jìn)行統(tǒng)計(jì)學(xué)檢驗(yàn),點(diǎn)擊Continue按鈕返回Factor analysis對話框點(diǎn)擊Rotation按鈕,彈出Factor Analysis:Rotation對話框,系統(tǒng)有5種因子旋轉(zhuǎn)方法可選。旋轉(zhuǎn)的目的是為了獲得簡單結(jié)構(gòu),以幫助我們解釋因子。本例選Varimax正交旋轉(zhuǎn)法,之后點(diǎn)擊Continue按鈕,返回Factor Analysis:對話框。點(diǎn)擊Extraction按鈕,彈出Factor Analysis:Extraction對話框,本例選用Principal compon

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論